Crear documentación de un proyecto Python con Sphinx#

Sin duda, una etapa importante en cualquier proyecto de desarrollo (y no solo de software) es la generación de la documentación. En el caso de software es posible asistirse de herramientas que ayudan a automatizar la generación de la documentación mediante extracción de comentarios en el código, usar palabras claves y lenguaje de marcado para modificación de estilo en el texto o inclusión de otros elementos que no sean solo texto plano (imágenes, ecuaciones, enlaces entre otros).

Algunas herramientas para este fin son Doxygen (habitual para proyectos en C/C++), Javadoc (para Java, pero habitual también en TypeScript), ESDoc (para Javascript) y por supuesto, Sphinx, para Python.

En esta entrada instalaremos lo necesario para generar nuestra documentación de un proyecto Python y haremos un pequeño ejemplo.

LaTeX#

Si deseamos generar documentación web, este paquete no es necesario, pero para generar nuestra documentación en PDF es una dependencia obligatoria. La instalación recomendada dependerá del sistema operativo que se use.

Mac

Puedes usar MacTex el cual incluye el compilador TeXLive y editores como TeXShop, y otras dependencias para el funcionamiento de LaTeX en Mac.

Windows

La opción más cómoda es el compilador MikTeX, el cual permite de forma predeterminada la descarga automática de paquetes adicionales en la medida que sean requeridos (instalación on the fly).

Es importante que en la configuración no cambies al modo silencioso, pues esto puede afectar la ejecución posterior en los casos que requieran de instalación.

Si usas Anaconda, puedes incluirlo desde el canal de conda-forge, conda install -c conda-forge miktex.

En la primera forma de instalación requieres instalar Perl, en la segunda, este viene como dependencia instalada por el gestor de paquetes. También puedes usar TeXLive para Windows, el cual asegura la consistencia en el resultado entre los 3 sistemas operativos.

Linux

En Linux usaremos TeXLive pero su instalación la haremos directamente del gestor de paquetes del sistema operativo. En la mayor parte de distribuciones Linux estará disponible a través del gestor.

En el caso de las distribuciones basadas en Debian (Ubuntu y Linux Mint entre otras) puedes instalar de la siguiente manera:

sudo apt install -y texlive texlive-latex-base texlive-latex-extra \
    texlive-lang-spanish latexmk

Sphinx#

Si usamos Python a través de Anaconda podemos usar el gestor conda para la instalación, así conda install sphinx, en caso contrario, podemos usar el gestor de paquetes PIP: pip install -U Sphinx.

Nota

Si deseas una experiencia en Windows similar a Linux, usando el Makefile tradicional y la posibilidad de usar en combinación con Bash, te recomiendo usar Git Bash, y si es en conjunto con Anaconda puedes leer mi publicación al respecto, Usar Anaconda Python en Git Bash e instalar el paquete make con Anaconda (conda install make) o instalar Mingw-w64.

Configuración de Sphinx#

Abriremos una consola (si es Windows, debes tener en cuenta que para usar paquetes de Anaconda debes usar las consolas Anaconda Prompt, Anaconda PowerShell u otra si la configuraste -como el caso de Git Bash que mencioné en la sección anterior-) y debemos ubicarnos en el directorio que destinaremos para la documentación. Es habitual que en la estructura de nuestro proyecto destinemos un directorio docs para este fin.

Ahora ejecutamos sphinx-quickstart y respondemos las preguntas que saldrán. Es necesario tener en cuenta, que si usas Windows debes agregar al comando la terminación .exe, ejemplo sphinx-quickstart.exe.

> Separate source and build directories (y/n) [n]: y
> Project name: proyecto
> Author name(s): Edward Villegas-Pulgarin
> Project release []: 0.1.0
> Project language [en]: es

Siempre recomiendo separar el directorio del código fuente de la documentación del directorio de compilados de la misma. Respecto al esquema de versiones me agrada el versionamiento semántico que permite al usuario final intuir un poco más sobre la madurez del proyecto con el número, pero puedes usar el esquema basado en fecha de liberación. En el lenguaje se especifica el lenguaje con el código a dos letras internacional, acorde a los soportados por Sphinx.

Aunque en la terminal nos indican que podemos continuar con el archivo index.rst, debemos hacer unos pequeños cambios en el archivo conf.py que encontraremos en docs/source.

Puedes saber más opciones de configuración en la documentación de Sphinx sobre conf.py.

Extensiones#

Recomiendo incluir la extensión de Autodoc para extraer automáticamente la documentación de la API, MathJax para el soporte de ecuaciones matemáticas en la versión Web y Napoleon para el estilo de Numpy y Google en la documentación. Con Coverage puedes validar que funciones se han documentado y dcotest integra pruebas de código desde la documentación (comparar salidas con ejemplo de documentación).

Modificar en el archivo.

extensions = [
    'sphinx.ext.autodoc',
    'sphinx.ext.mathjax',
    'sphinx.ext.napoleon',
    'sphinx.ext.coverage',
    'sphinx.ext.doctest'
]

Importar tu proyecto#

Para actualizar automáticamente los metadatos desde el código (ejemplo, el autor o la versión) puedes importar el paquete en el archivo de configuración. Dado que estarás en modo de desarrollo, probablemente el paquete no ha sido instalado y lo deberás hacer descomentando las tres primeras líneas de código en la sección de Path setup. El punto que hay por defecto indica la misma carpeta de docs/source, por lo cual es necesario reemplazar por ../.. que se devuelve los dos niveles necesarios.

import os
import sys
import datetime
sys.path.insert(0, os.path.abspath('../..'))
import proyecto

Ahora, puedes hacer cosas como la siguiente, si está disponible en tu código.

author = proyecto.__author__
copyright = str(datetime.date.today().year) + ", " + author
release = proyecto.__version__

Esto tiene un impacto respecto a algunas dependencias, que pueden provocar fallos o si para la generación de la documentación no tenemos todas las dependencias del paquete. En mi caso, he tenido problemas cuando tengo como dependencia Tensorflow o cuando tengo ArcPy pero no tengo la licencia instalada. En este caso, podemos hacer un falseo (mock) de los paquetes:

autodoc_mock_imports = ["tensorflow", "arcpy"]

Referencias cruzadas#

Para usar referencias cruzadas, es decir, numeración de tablas, figuras, códigos y ecuaciones si poseen pie de objeto, y ser referenciados en el texto por el número, se requiere configurar lo siguiente.

numfig = True
numfig_format = {'figure': 'Fig. %s', 'table': 'Tabla %s',
                 'code-block': 'Código %s', 'section': 'Sección %s'}
numfig_secnum_depth = 1
math_numfig = True
math_eqref_format = 'Ec. {number}'

Así, es posible usar :label: para asignar una referencia a los objetos y :numref: y :eq: a la hora de mencionarlos. Con numfig_secnum_depth configuras la numeración de los objetos, si es continúa (0), por sección (1) y subsección (2).

LaTeX#

Hay una configuración básica para LaTeX que puedes agregar. El documento maestro, el nombre del archivo TeX, el nombre de nuestra documentación, el nombre del autor (que podemos usar la variable que ya definimos) y el tipo de documento (cuya clase manual está definida por Sphinx).

master_doc = 'index'
latex_documents = [
    (master_doc, 'proyecto.tex', 'Documentación Proyecto',
     author, 'manual'),
]

Escritura en ReStructuredText#

Sobre esto, es referencia ver la documentación de DocUtils y de Sphinx ReStructuredText Primer.

Una vez tienes las bases de ReStructuredText puedes editar lo básico. De ahí, y para tener todo el provecho de Sphinx hay elementos como los roles, directivas y dominios que debes aprender a usar, Sphinx ReStructuredText.

¿Y por qué los dominios? Estos añaden sintaxis para manejar las relaciones con el código, como enlazar a funciones relacionadas que se generaron con autodoc y además la forma de como documentar la función (u otro elemento del código) en su código fuente y que pueda ser extraída. Por ejemplo, el dominio de Python.

¿Qué archivos debo editar?#

Primero, editaremos docs/source/index.rst, donde deberemos agregar los nombres de los archivos que se incluyen en la documentación, tanto los generados como los automáticos. Se agrega uno por línea, sin extensión y la posición es relativa a la ubicación del archivo index.rst.

Te recomiendo siempre un archivo README.rst que fija la generalidad e intención del proyecto, history.rst para tener documentados los cambios entre versiones (como un changelog pero a mano, más condensado), un usage.rst documentando el uso de nuestro proyecto, installation.rst con instrucciones de instalación y adicional, agregar una ruta a la documentación de la API (la misma ruta la debemos indicar más adelante). Puedes agregar más archivos, por ejemplo, yo suelo usar un concepts.rst para detallar los conceptos necesarios antes de usar el software o detallar teoría que ayuda a interpretar resultados o que expande la información para que alguien pueda analizar o continuar un desarrollo.

.. toctree::
   :maxdepth: 3
   :caption: Contenido:

   README
   installation
   usage
   api/modules
   concepts
   history

Y podemos borrar las líneas posteriores de Indices and tables.

Vemos la mención a api/modules, la cual es importante para incluir la documentación automática extraída con Sphinx, que se explicará en la próxima sección.

Ejecución de Sphinx#

Como estamos haciendo uso de autodoc, nuestro primer paso es generar la extracción de la API.

sphinx-apidoc -f -M -o source/api/ ../proyecto

Recordar que en Windows hay que agregar .exe (sphinx-apidoc.exe). -f es para forzar la regeneración de los archivos (importante si actualizamos la documentación de la API), -M para ubicar primero la documentación de los módulos (por defecto primero son las funciones, y esto no me parece natural). Luego, es la ruta para la documentación de la API (uno de los archivos será el api/modules.rst) y finalmente la ruta donde se encuentra el paquete. Ambas rutas son relativas al directorio de documentación.

Ahora, solo es necesario generar la documentación: make latexpdf si es con el Makefile o make.bat latexpdf si no instalaste make en Windows. Aquí debemos devolvernos un nivel en la carpeta para ejecutarlo.

Publicar#

Ahora encontrarás en la carpeta build los archivos LaTeX, y uno de ellos será el PDF que queremos. También puedes hacer compilación HTML (make html) y usar esta para publicar como un GitHub Pages o en ReadTheDocs.