Cómo leer un archivo DOC usando PHP

Cómo leer un archivo DOC usando PHP

Los programadores de PHP a menudo buscan formas de extender la funcionalidad de este lenguaje fuera de su zona de confort. PHP se utiliza principalmente en sistemas operativos Linux, pero los visitantes de los sitios web PHP suelen trabajar en sistemas Windows o Macintosh. Un sitio web diseñado para cargar un archivo de Microsoft Word de estos usuarios puede necesitar extraer el contenido de este archivo y enviarlo por correo electrónico o procesar su texto usando algoritmos PHP. Pero los archivos de Microsoft Word, que terminan en la extensión DOC, no son nativos de Linux o PHP. Unir estos dos entornos informáticos es posible con un poco de preparación.

Paso 1

Verifique con su proveedor de alojamiento que el acceso PHP esté disponible para su sitio web. La mayoría de los servidores admiten PHP, pero ocasionalmente este servicio requiere una actualización de cuenta. No puede leer un archivo DOC usando PHP sin acceso al compilador.

Paso 2

Descargue la utilidad de lectura de documentos Antiword MS Word (consulte Referencias). Este programa de código abierto contiene materiales de programación que amplían PHP para la conversión de DOC.

Paso 3

Descomprima el archivo Antiword para extraer su contenido.

Paso 4

Sube toda la biblioteca de archivos Antiword al servidor web. Coloque los archivos en el directorio «bin» de la cuenta de host. Este directorio es un repositorio común de utilidades y otras operaciones binarias que los usuarios del servidor web deben explotar con frecuencia.

Paso 5

Llame al programa Antiword en cualquier script PHP diseñado para leer un documento DOC de Microsoft Word. El comando se implementa mediante una única función. Escriba «$ content = shell_exec (‘/ usr / local / bin / antiword’. $ Nombre de archivo);» donde «$ filename» es igual al nombre de archivo completo del documento DOC. El contenido del archivo DOC se leerá en la variable «$ contenido». Estos nombres de variables, que comienzan con el símbolo «$», son personalizables.

Encuentra Más Guías Aquí  Cómo cambiar archivos de solo lectura en Microsoft Word

Procese la variable «$ content» como desee para manipular el contenido del archivo DOC. Una vez que PHP lee el DOC, el texto completo del archivo está disponible para cualquier forma de actividad adicional. El contenido puede enviarse por correo electrónico o almacenarse en una base de datos, por ejemplo.