Projeto simples para leitura e interpretação de texto de imagens, PDFs e texto puro
- Streamlit 📊
- EasyOCR 👁️
- pdf2image 📄
- Google Gemini LLM 🤖
Com a Docker Engine instalada e sendo executada na sua máquina, primeiro clone o repositório:
# Clonando o repositório
git clone https://github.com/Educg550/document_reader.git
Após, insira a sua chave da API do Gemini em um arquivo .env
na raiz do projeto (caso deseje utilizar a LLM para detecção):
Exemplo de arquivo .env
:
GOOGLE_API_KEY="SUA_CHAVE_AQUI"
Você pode manter o arquivo .env
vazio caso não vá usar detecção com LLM. Em seguida, execute os comandos:
# Criando a imagem Docker
make
# Executando o container
make run
Uma imagem ocr-image-reader
será criada na sua máquina e um container de mesmo nome será executado.
Com o container em execução, acesse o endereço http://localhost:8501
no seu navegador para acessar a interface gráfica feita com Streamlit. Você verá uma página com um campo para upload de arquivos. Os seguintes arquivos são compatíveis:
- Texto puro (
.txt
) - PDF (
.pdf
) - Imagens (
.png
,.jpg
,.jpeg
)
Após feita uma modificação no código, você pode reconstruir a imagem Docker com o comando:
make rebuild
O comando acima irá reconstruir e executar a imagem ocr-image-reader
em um novo container, com a última versão do código.