Alguma solução em Python para detectar fórmula matemática em PDF?

Pessoas, preciso muito de ajuda!!

Eu preciso detectar fórmulas matemáticas de PDF. Elas estão como texto, e apenas extrair como texto está dando ruim. Alguém sabe um jeito, mesmo que converta para imagem? Seria bom se desse para salvar em alguma notação compreensível em texto ou algo que pudéssemos converter a notação.

Se o PDF foi criado com LaTeX, uma opção é tentar extrair o código LaTeX diretamente. Ferramentas como pdf2tex podem ajudar a reconstruir o código-fonte do documento, incluindo as fórmulas matemáticas. Isso nem sempre funciona.