Captura de informações de processos judiciais nos sites dos Tribunais de Justiça dos estados

已关闭 已发布的 7 年前 货到付款
已关闭 货到付款

O projeto consiste em produzir um algoritmo de webscrapping em Python para capturar as informações de processos judiciais dos sites dos sistemas dos Tribunais de Justiça de diferentes estados.

O algoritmo deve:

(1). Ler uma lista de números de processos e de estados, em um arquivo de texto;

(2). Para cada número de processo contido no arquivo, o algoritmo deve acessar o site correspondente ao tribunal do estado, preencher o número do processo e submeter o formulário. Na maioria dos estados, o formulário contém um CAPTCHA, que o algoritmo deve solucionar.

(3). Em seguida, é carregada uma página com as informações do processo. Essas informações devem ser extraídas e salvas em um arquivo JSON.

A entrega consiste:

(1). No arquivo JSON completo, para os estados especificados e para o período de tempo especificado

(2). No código do algoritmo, para que possa ser aplicado para novos números de processo e para a atualização sobre o andamento de processos já coletados.

Requisito: emitir nota fiscal

数据挖掘 网页搜罗

项目ID: #12735507

关于项目

3个方案 远程项目 活跃的7 年前

有3名威客正在参与此工作的竞标,均价R$1917/小时

adilhussain0411

Dear hiring manager, My name is Mehnaz Bashir. I have experience on Parsing of web sites. I know Java, Python and use many libraries for web scrapping (I use jsoup library) into Excel, csv, JSON, text document or dat 更多

R$750 BRL 在10天内
(3条评论)
3.5
RubyOnRail

Hello, Its a pleasure to let you know that I've Completed and Delivered similar project before. All I need to work upon customization part, if we can proceed towards more discussion. I have gone through your project 更多

R$2500 BRL 在25天内
(0条评论)
0.0
expertdevteam

Olá senhor, Somos uma empresa indiana de desenvolvimento aqui. Nós verificamos seus detalhes afixados aqui e queremos mais esclarecimentos nele, assim que a mensagem nós para discutir sobre ele mais então nós poder 更多

R$1666 BRL 在10天内
(0条评论)
0.0
R$2500 BRL 在10天内
(0条评论)
0.0