Este script Python exemplifica a utilização do serviço Azure AI Text Analytics para analisar o sentimento de avaliações do Google para uma lista de empresas fornecida pelo usuário.
🧹Não sabe como apagar? 👉 Veja aqui
📝Documentação Azure AI Text Analytics
😺 Repositorio GIT azure-sdk-for-python com exemplos
- Requisitos
- Instalação e Configuração
- Como Usar
- Exemplo de Uso
- Recursos do Azure Text Analytics
- Licença
- Python 3.x
- Conta no Azure com o serviço Text Analytics habilitado Não tem? 👉 Crie aqui sua conta Gratuita
- Chave e Endpoint da API Não tem? 👉 Veja aqui
-
Configure as variáveis de ambiente com o endpoint e a chave da API do Azure Text Analytics:
Para usuários do Linux:
export TEXT_ANALYTICS_ENDPOINT=<seu_endpoint> export TEXT_ANALYTICS_KEY=<sua_chave>
Para usuários do Windows:
- Abra o menu Iniciar e pesquise por "Variáveis de ambiente".
- Clique em "Editar variáveis de ambiente do sistema".
- Na janela de Propriedades do sistema, clique no botão "Variáveis de ambiente".
- Na seção "Variáveis do sistema", clique em "Novo..." para adicionar uma nova variável.
- Em "Nome da variável", insira
TEXT_ANALYTICS_ENDPOINT
. - Em "Valor da variável", insira o endpoint do Azure Vision.
- Repita as etapas anteriores para adicionar a chave da API, utilizando
TEXT_ANALYTICS_KEY
como nome da variável e sua chave como valor. - Clique em "OK" para fechar todas as janelas de configuração.
-
Clone este repositório para o seu ambiente local:
git clone https://github.com/megarj/Microsoft-Azure-AI-Text-Analysis.git
-
Navegue até o diretório do projeto:
cd Microsoft-Azure-AI-Text-Analysis
-
Crie e ative um ambiente virtual Python:
python -m venv escolha-nome-ambiente escolha-nome-ambiente\Scripts\activate
python -m venv escolha-nome-ambiente source escolha-nome-ambiente/bin/activate
Essas instruções criam e ativam um ambiente virtual Python no respectivo sistema operacional. Certifique-se de substituir escolha-nome-ambiente
pelo nome desejado para o seu ambiente virtual.
-
Instale as dependências necessárias:
pip install -r requirements.txt
-
Navegador Web: Este projeto usa o Selenium para automatizar um navegador web. Por padrão, usamos o Google Chrome, mas você pode alterar para qualquer navegador suportado pelo Selenium. Os navegadores suportados pelo Selenium incluem Google Chrome, Firefox, Safari, Edge, entre outros. Certifique-se de ter o navegador de sua escolha instalado em seu computador. Você pode baixar o Google Chrome do site oficial do Google Chrome. Se você optar por usar um navegador diferente, certifique-se de atualizar o código e o driver do navegador conforme necessário.
Este projeto pode ser usado de duas maneiras:
-
Se você quer coletar avaliações do Google e analisá-las: Execute o seguinte comando:
python main.py
Digite a opção 1
Quando solicitado, digite uma lista de empresas para pesquisar, separadas por vírgulas. O script irá coletar as avaliações do Google Meu Negócio para cada empresa, salvar as avaliações apenas da primeira página aberta para fins de testes em arquivos de texto na pastainputs
, analisar as avaliações e salvar os resultados da análise em novos arquivos com o prefixoanalise_
. -
Se você já tem o texto a ser analisado: Coloque o arquivo de texto (ou arquivos, se tiver mais de um) na pasta
inputs
e execute o seguinte comando:python main.py
Digite a opção 2
Isso irá analisar o texto e salvar um novo arquivo eminputs
com o prefixoanalise_
seguido pelo nome do arquivo de texto original. Por exemplo, se o arquivo de texto original se chamameu_texto.txt
, o arquivo de análise seráanalise_meu_texto.txt
.
Aqui está um exemplo de como um texto é analisado usando este projeto.
Vinicius Viana
Local Guide·130 comentários·544 fotos
5 dias atrás
NOVA
É uma parada obrigatória quando se fala em turismo no centro histórico de São Paulo. Achei o ambiente bem legal, muita coisa interessante. Os estúdios de tatuagem e body piercing transmitem segurança, qualidade e preço justo. Super recomendo a visita.
Vinicius Viana
Local Guide·130 comentários·544 fotos
5 dias atrás
NOVA
É uma parada obrigatória quando se fala em turismo no centro histórico de São Paulo. Achei o ambiente bem legal, muita coisa interessante. Os estúdios de tatuagem e body piercing transmitem segurança, qualidade e preço justo. Super recomendo a visita.
Sentimento do Documento: positivo
Pontuações gerais: positivo=0.84; neutro=0.16; negativo=0.01
Principais frases: centro histórico, São Paulo, preço, Vinicius Viana, Local Guide, comentários, estúdios, body piercing, segurança, 544 fotos, NOVA, parada, turismo, ambiente, coisa, tatuagem, qualidade, visita
Recurso | Descrição |
---|---|
Análise de Sentimento | Analisa o sentimento do texto. |
Reconher Entidades | Reconhece e categoriza entidades no texto. |
Reconhecer Entidades Vinculadas | Reconhece e desambigua a identidade de cada entidade(por exemplo, determinar se a ocorrência Marte se refere ao planeta ou ao Deus romano da guerra) |
Reconhecer entidades PII | Reconhece e categoriza entidades de PII (Informações de Identificação Pessoal) em seu texto de entrada, como Números da Previdência Social, informações de conta bancária, números de cartão de crédito e muito mais |
Extrair frases-chave | Determina os pontos de discussão main em seu texto de entrada. Por exemplo, para o texto de entrada "A comida estava deliciosa e havia uma equipe maravilhosa", a API retorna: "comida" e "equipe maravilhosa". |
Detectar o idioma | Determina o idioma de seu texto de entrada, incluindo a pontuação de confiança do idioma previsto. |
Análise de entidades de saúde | Extrai entidades reconhecidas dentro do domínio de saúde e identifica relações entre entidades dentro do documento de entrada e links para fontes de informações conhecidas em vários bancos de dados conhecidos, como UMLS, CHV, MSH etc. |
Análise múltipla | Executa várias análises em um conjunto de documentos em uma única solicitação. |
Reconhecimento de Entidade Personalizada | Reconhece entidades personalizadas no texto. |
Classificação personalizada de rótulo único | Classifica o texto em uma única categoria personalizada. |
Classificação de vários rótulos personalizados | Classifica o texto em várias categorias personalizadas. Por exemplo, resumos de filmes podem ser categorizados em vários gêneros de filmes como "Ação", "Comédia" ou "Drama", etc. |
Resumo extrativo | Extrai as frases mais relevantes do texto. |
Resumo abstrativo | Gera um resumo abstrato do texto. |
Para mais exemplos de como utilizar esses recursos, consulte a documentação oficial da API Azure Text Analytics.
Este projeto está licenciado sob a Licença MIT.
Gostou, achou útil? Considere dar uma estrela 😉