Blog NCDD

image

Dosimetria da pena com Rede Neural

Esse projeto eu fiz em 2009, nele usei uma rede neural backpropagation com lógica fuzzy aplicado a dosimetria da pena. Ainda falta aprimorar o método. Mas a ideia do App, é o usuário criar seus padrões e utilizar para realizar a pena base.

O projeto está no link a seguir que dá acesso ao Google Play para baixar (Download aqui).

O sistema leva em conta o Emprego do sistema trifásico para aplicação da pena que são:

  • Circunstâncias judiciais
  • Culpabilidade
  • Antecedentes
  • Conduta social
  • Motivo do crime
  • Circunstância do crime
  • Consequência do crime
  • Comportamento da vítima
  • Um resumo do trabalho escrito na época pode ser visto aqui no meu Github. No link você pode baixar uma versão no algoritmo em C++ e o artigo com alguns detalhes. Na época, havia poucos frameworks de data Science, ou seja, o programador tinha que fazer todos algoritmo na "unha"

    image

    Qual o custo de um Modelo de Machine Learning

    Neste post vamos discutir o custo do modelo, esse custo é em relação ao negócio. Então, vamos imaginar a seguinte situação, você criou um modelo de prevenção de fraude para uma empresa que concede empréstimos e você quer prevenir que a empresa tenha perdas com fraudes. Vamos considerar que seu modelo de treino tem 1000 instâncias e você projetou dois modelos: A e B.

    Modelo A

  • Precisão: 70%
  • Falsos Positivos: 250 transações (25%)
  • Falsos Negativos: 50 transações (5%)
  • Modelo B

  • Precisão: 69%
  • Falsos Positivos: 230 transações (23%)
  • Falsos Negativos: 80 transações (8%)
  • A gente pode perceber que o modelo A tem desempenho melhor que o B. Mas as taxas de erros entre os dois modelos são diferentes. Mas para o negocio o que representa essas taxas de erros?

  • Falso Positivos: Maus pagadores, mas que eu vou ceder empréstimo. Prejuízo ou Perda de Dinheiro
  • Falsos Negativos: Bons pagadores, mas que eu não vou ceder empréstimo. Perdi Negócios ou Perda de Oportunidade.

  • De um modo geral os dois casos eu tenho prejuízo. Agora vamos analisar do ponto de vista do custo. Considere a seguinte situação:

  • Ceder um empréstimo a um mal pagador: Perda média de R$ 1.000,00
  • Perder uma oportunidade de empréstimo: Perda média de R$ 450,00

  • Então, se a gente pegar esses dois modelos e calcular o custo deles, no sentido de perdas de dinheiro e perdas de oportunidades de lucro, pode-se colocar isso do ponto de vista quantitativo, que resulta em:

    Modelo A

  • Perda de dinheiro: 250.000
  • Perda de oportunidades: 22.500
  • Total: 272.500
  • Modelo B

  • Perda de dinheiro: 220.000
  • Perda de oportunidades: 36.000
  • Total: 266.000
  • O que podemos observar nos resultados acima? Do ponto de visto de custo o modelo B é mais interessante, porque a perda que vou ter no negócio é menor. Na prática, na maioria das vezes, você não pode avaliar o modelo somente pela precisão dele. Às vezes, outros indicadores, são mais interessantes para aquele modelo de negócio do que simplesmente a precisão. Você pode até criar uma equação que faz esses cálculos de forma simples. Claro que contabilmente pode ser calculado de outra forma, por exemplo, perda financeira não é a mesma coisa que perda de oportunidade, entre outras. Aqui é apenas para simplificar o post.

    Como melhorar o modelo?

  • Testando diferentes algoritmos
  • Parametrizando algoritmos
  • Selecionando e tratando dados
  • Seleção de atributos
  • image

    Avaliando a viabilidade de um modelo de Machine Learning

    Considere o seguinte cenário:

  • O cliente vende um produto com preço fixo de R$ 50,00
  • São realizadas 30 mil transações por mês
  • 15% das transações são fraudulentas (4500)
  • Faturamento mensal: R$ 1.275.000,00
  • Perdas com as Fraudes: R$ 225.000,00
  • Margem de lucro (5%): 63.750,00

  • Pergunta-se, eu posso reduzir minha perda com fraudes?
    Vamos coletar dados, fazer testes e conseguir um modelo com acerto em 90%. A proposta:
  • Reduzir fraude de 15% para 10%
  • Faturamento mensal: de R$ 1.275.000,00 para 1.350.000,00
  • Perdas com Fraude: de R$ 225.000,00 para 150.000,00
  • Custo do projeto: R$ 300.000,00 e um ROI em apenas 4 meses.
    Será que é seguro afirmar um acerto de 90%? a resposta é não, porque estamos trabalhando com amostras, e estas estão sujeitas a variabilidade. Modelos de negócio mudam rapidamente, e isso pode influenciar o seu resultado, as vezes de forma mais rápida do que sua atualização do modelo. Então, como fazer?

    Existe vários métodos para responder essa questão. Mas uma forma simples seria prever uma variabilidade no resultado. De que forma? utilizar intervalos de confiança.

  • Intervalo de Confiança para a média (rodando várias vezes e usando a média), ou
  • Intervalo de Confiança para a proporção (rodando o modelo uma única vez)
  • Vamos supor que vamos rodar para a média, ou seja, 100 modelos criados – amostra (n). Intervalo de Confiança: 95%, Valor de Z = 1.96; Desvio padrão de 12,61; média de 88,2. Portanto, o acerto médio do modelo de Machine Learning deve variar entre 85,7 e 90,67, com um nível de confiança de 95%. O valor de intervalo de confiança para a média é +/- 2,47. Lembre-se que os dados de treino dos modelos devem ser escolhidos por funções que deem aos mesmos as mesmas chances de serem selecionados. Agora você não vai dizer para seu cliente que vai acertar 90%, você deve dizer que o acerto médio de machine learning que está sendo implementado é variádo entre 85,7 e 90,67. Para achar esse valor utilizamos a média + ou menos o 2.47. Esse seria do ponto de vista técnico a forma mais correta de apresentar o resultado de seu modelo e o provável desempenho do seu modelo.

    Agora vamos utilizar o intervalo de confiança para a proporção, neste caso você vai criar o modelo apenas uma vez. Então você, por exemplo, pega 1000 registros (n) (dados de treino). Seu intervalo de confiança é de 95%; Valor de Z = 1,96; a proposrção de acertos é P(a) = 0,9 e P(e) = 0,1. Portanto, A proporção de acertos esperado da aplicação de Machine Learning na detecção de fraudes, é entre 88 e 92%, com um nível de confiança de 95%. O valor de p é + ou - 0,018 ou arredondando para 0,02. Da mesma forma que no método da média, aqui você irá informar ao seu cliente que terá essa variação.

    image

    Projetos para testar Data Science

    Estou disponibilizando vários projetos de Data Science que foram desenvolvidos por mim para qualquer pessoa testar e avaliar. O primeiro projeto pode ser acessado aqui, este primeiro é um projeto simplificado de análise de risco.

    Esse segundo projeto utiliza um algoritmo de Machine Learning para fazer predição da qualidade de veículos, veja no link.

    Outro projeto foi o resolver o problema de transporte de carga com o Bat Algorithms (problema de otimização), eu já tinha publicado vários artigos em 2017 e 2018 sobre esse algoritmo. Agora resolvi publicar uma aplicação simples para ser testado on-line. Segue o link aqui.

    Em breve, publicaremos outros projetos utilizando redes neurais convolucionais e visão computacional.

    image

    Isolamento Social no Brasil - Covid-19

    O professor Nielsen finalizou um e submetido um artigo juntamente com outros pesquisadores da universidade federal do Rio Grande do Norte (UFRN) que utiliza os dados da empresa Inloco. Esses dados são disponível gratuitamente no link Portal Inloco

    Com o indice podemos mostrar um gráfico ou mapa do percentual da população que está respeitando a recomendação de isolamento. Esses dados nos permite auxiliar as autoridades a direcionarem os recursos de segurança pública, comunicação e saúde. Os também foram compilados em um arquivo csv e disponível no nosso Github. Em breve, publicaremos aqui no portal o artigo que está sob revisão.

    image

    Combate ao Covid-19

    O Ph.D. Nielsen Castelo e o engenheiro Anderson (da empresa Updados) desenvolveram um sistema de detecção do covid-19 baseado na imagem da tomografia computadorizada (TC).

    O sistema foi treinado com mais de 2000 imagens disponibilizado pelo hospital de São Paulo. O sistema tem uma acurácia de 92 % e foi treinado com algoritmo de redes neurais convolucionais e utiliza técnicas de visão computacional. O projeto se tornou um portal e pode ser acessado através do link The Clinical Vision. O cadastro no portal é gratuito e está em fase de experiência pelos médicos.

    image

    Aplicativo para controle de Drone Matrice 100

    Desenvolvemos um sistema Android Java para controle e monitoramento do Drone Matrice 100.

    O primeiro teste do protótipo é apresentado no vídeo que pode ser acessar clicando na imagem do post. O objetivo é o drone fazer o inventário. Para isso, ele utiliza vários sensores como, RTLS, GPS e visão computacional. O Projeto é em conjunto entre a NCDD, Coca-Cola e a GTP Automation. Uma versão web foi desenvolvido pela empresa GTP para o controle do drone, os testes iniciais pode ser acessado aqui. Nesse outro vídeo fazermos a instalação do sensor Lidar no Drone. Esse sensor é responsável para verificar os paletes que estão abaixo e na frente do drone.

    image

    Detecção de palete usando visão computacional

    Nesse projeto, utilizou-se técnicas de visão computacional para detecção de palete de empilhadeiras. O sistema é embarcado na empilhadeira no para-brisa dianteiro. Ele utiliza câmeras de uma raspberry pi 3, seu objetivo é saber se o empilhador está realizando sua tarefa de forma correta. O vídeo dos testes iniciais podem ser acessado clicando na imagem desse post.

    image

    Teste de sistema de pesagem para empilhadeiras

    O Engenherios de Computação Dr. Nielsen Castelo e o Engenheiro Eletricista Manoel Gomes fizeram vários testes em um protótipo que tem alta precisão para medições de paletes embarcado na empilhadeira.

    Clique na imagem desse post para ver o video do teste. Neste vídeo estamos fazendo testes no sistema de pesagem que desenvolvemos para qualquer tipo de empilhadeira. No vídeo fazemos medições do peso do palete em uma empilhadeira Toyota. O objetivo é medir o peso do palete para estimar a quantidade de produtos. Essas informações são enviadas em tempo real para o servidor e comparados com notas fiscais, inventário etc.

    image

    Mobitech com integração com e-SUS AB

    Fizemos uma melhoria no sistema Mobitech Desktop para integração com o e-sus AB.

    O vídeo que é acessado clicando na imagem desse post mostra uma visão geral de como o sistema funcional. O Sistema Mobitech já é um sucesso em algumas prefeituras do estado do Rio Grande do Norte, A versão Mobile já vai na sua segunda versão, por enquanto ainda disponível apenas na versão Android, confira aqui. A NCDD e a Soultech está procurando novos parceiros, caso tenha interesse em saber mais sobre o projeto entre em contato com a nossa equipe.

    image

    Aplicativo Android Beauty Nice Free

    Agora o aplicativo Beauty Nice é free. Este aplicativo é algo novo no mercado para os micro empreendedores individuais. Pensando nesse tipo de profissional a NCDD desenvolveu este App para controle de seus clientes. Faça o download do aplicativo clicando na imagem deste post. Com este App você:

  • Cadastra clientes.
  • Cadastra serviços com seus preços
  • Cadastra produtos, preços e estoque
  • Realiza um atendimento e cria lembretes pra seus clientes
  • Recebe pagamentos de atendimentos e vendas de produtos
  • Gera relatório de vendas e atendimento de acordo com o período desejado.
  • Manda lembre para seus clientes através do WhatsApp
  • Tem o Controle/notificação de ganhos por mês de acordo com o valor do MEI