自建 PDF 工具记录
构建
https://github.com/danvergara/morphos https://github.com/C4illin/ConvertX 这两个都是垃圾。中文支持很差。全是转换结果为乱码方块。可以通过构建字体到 docker 目录下,实现正确显示中文相对应的字体。同时 s-pdf 也可以用此方法。不过,前两者无法从 pdf 转为 doc 和 docx ,s-pdf 可以转换,但是也不完美,最终内容整体偏右。字体必须是对应的英文字体名称加上tff后缀,才能被容器内的 Linux 识别到。以 convertx 为例如下。其他 PDF 服务可参考执行。
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 |
services: convertx: build: context: . volumes: - ./data:/app/data environment: - ACCOUNT_REGISTRATION=false - JWT_SECRET=${CONVERTX_JWT_SECRET} - HTTP_ALLOWED=false - ALLOW_UNAUTHENTICATED=false - TZ=Asia/Shanghai ports: - 3000:3000 networks: - my-net-ipv6 networks: my-net-ipv6: external: true |
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 |
cat > Dockerfile <<'EOF' FROM ghcr.io/c4illin/convertx:latest # 切换到 root 用户 USER root # 将宿主机 fonts 目录下的所有字体复制到镜像 COPY fonts/*.ttf /usr/share/fonts/truetype/ COPY fonts/*.otf /usr/share/fonts/opentype/ # 刷新字体缓存,让系统识别新字体 RUN fc-cache -f -v EOF</code><code> |
THE END