注意点:上传文件名生成一个别名备用,在文件路径中使用英文或数组

总结下:

1.碰到的坑不少,网上资料很多不全面,就拿linux上安装openoffice来说,需要安装一堆的依赖才成功跑起来

安装的方法给个地址:https://blog.csdn.net/qq_27229113/article/details/82054128

2.刚开始的时候在windows调试,只使用一个openoffice即可,当然windows配置也比较复杂,写过另外一篇,

地址: https://blog.csdn.net/qq_27229113/article/details/81984394,用完后发现咋ewindows上不能支持excel,有点尴尬,这里我没有再去调试,或许是可以的,大家自行调试

3.当部署到linux上的时候,发现,com组下在linxux系统不支持,最后找到一种方法,是java的JODConverter包,用起来也比较方便,安装比较简单,在下面我已经贴出来了,自行参考,

4.字体编码乱码的问题,我将linux系统设置为中文zh_CN.utf8,后面发现不是这个问题,我把centos系统自己增加了微软雅黑和黑体,没效果,openoffice增加字体,没效果,最后将java的jdk下添加字体成功了,这里爬坑挺多的

5.最后说说和自己犯得错,我前期忘了将上传的文件转为英文格式,导致在用php调取命令行的时候出现报错,也就是下面的php调用的时候出现了,所有转为统一规范的英文名字,

希望对大家有用.看了挺多的教程,php转office的方法确实比较少,点个关注!谢谢,转载几个放个我地址

 

开始搞!!!

JODConverter(Java OpenDocument Converter),可以转换不同Office格式的文档。它利用OpenOffice.org,可以自动化OpenOffice.org支持的所有转换。包括转换为pdf文件,部分支持转换到html文件。

JODConverter下载地址:https://sourceforge.net/projects/jodconverter

openoffice安装请移步:http://www.webyang.net/Html/web/article_336.html

进入目录:cd /opt
下载:wget https://downloads.sourceforge.net/project/jodconverter/JODConverter/2.2.2/jodconverter-2.2.2.zip
解压:unzip jodconverter-2.2.2.zip
进入目录:cd jodconverter-2.2.2/lib
测试转换(test.docx=>test.pdf):java -jar jodconverter-cli-2.2.2.jar test.docx test.pdf
显示:
Sep 20, 2017 3:40:05 PM com.artofsolving.jodconverter.openoffice.connection.AbstractOpenOfficeConnection connect
INFO: connected
Sep 20, 2017 3:40:06 PM com.artofsolving.jodconverter.openoffice.connection.AbstractOpenOfficeConnection disposing
INFO: disconnected

查看,已经有了test.pdf,可以直接访问。

php调用
<?php
$command = "java -jar /opt/jodconverter-2.2.2/lib/jodconverter-cli-2.2.2.jar test.docx test.pdf";
//exec($command, $output);
//system($command);
passthru($command);

三个方法任选一种即可,根据需求可以封装成一个通用方法。
注意下,这三个方法可能是php的禁用方法,在php.ini中修改disable_functions即可。 
 

window下还可以试下通过php的COM组件来实现此功能。注意:com组件只支持window环境。 
另外还有很多在线转换的,也可以去看看~

java命令输入java的安装路径(这里要注意jdk的绝对路径,要不然在php代码里面无法唤起jdk,切记)
例如
/opt/local/jdk1.8.0_131/bin/java -jar /opt/jodconverter-2.2.2/lib/jodconverter-cli-2.2.2.jar /opt/local/nginx-1.12.0/html/content/web/upload/file/999.doc /opt/local/nginx-1.12.0/html/content/web/upload/pdf/999_doc.pdf

下面就是乱码的问题了

字体下载地址: https://download.csdn.net/download/qq_27229113/10643969

编码问题解决

 

查看系统编码
echo $LANG
设置系统编码
export LC_ALL="zh_CN.utf8"

 

字体编码问题的尝试

用vim /etc/fonts/fonts.conf,可以看到系统字体文件在/usr/share/fonts,将windows系统字体文件连接到此目录下
ln -s /usr/local/fonts fonts
然后更新缓存:fc-cache
重启openoffice:
 /opt/openoffice4/program/soffice -headless -accept="socket,host=127.0.0.1,port=8100;urp;" -nofirststartwizard &
再转换,字体终于显示正确,不再有乱码

问题解决: 
尝试一:此时可能是linux下的jre没有相应的中文字体的问题 

尝试二:openoffice字体问题

尝试三:java的jdk字体问题

结论:是jdk的字体,一个是openoffice字体,(有可能个人安装的linux系统有所不同,大家多做尝试)

方法:
下载 simhei.ttf 黑体 
simsun.ttc 宋体 
两种字体文件 

1.
找到jre的字体路径:/usr/jdk1.6.0_22/jre/lib/fonts 
新建文件夹fallback:mkdir fallback 
将字体simhei.ttf 、simsun.ttc拷贝到/usr/jdk1.6.0_22/jre/lib/fonts/fallback目录下 
重启openoffice 
ps ax|grep soffice 
显示如下: 
22739 pts/5 S 0:00 /bin/sh /opt/openoffice.org3/program/soffice -headless -accept=socket,host=127.0.0.1,port=8100;urp; -nofirststartwizard 
22747 pts/5 Sl 0:01 /opt/openoffice.org3/program/soffice.bin -headless -accept=socket,host=127.0.0.1,port=8100;urp; -nofirststartwizard 
23789 pts/5 S+ 0:00 grep soffice 
关闭soffice进程:kill 22739 
以后台启动openoffice: 
/opt/openoffice.org3/program/soffice -headless -accept=socket,host=127.0.0.1,port=8100;urp; -nofirststartwizard &; 

2.linux系统下字体和openoffice字体都是找的相应目录fonts存放即可

例如:

/usr/share/fonts 下放中文字体

fc-cache-fv 更新字体缓存

 

好了,希望对大家有用!

Logo

更多推荐