‘Pequenos dados’ também são cruciais para o aprendizado de máquina
No mundo do aprendizado de máquina, big data se refere a uma vasta coleção de informações estruturadas e não estruturadas. No entanto, isso não significa que “pequenos dados” sejam menos importantes. Na verdade, pode ser tão crucial para o sucesso de sua organização.
Um artigo recente da Scientific American, explica completamente o poder dos pequenos dados e como eles podem impactar seus negócios de maneira positiva. Pode até fornecer uma vantagem competitiva significativa sobre concorrentes maiores utilizando este refino como uma etapa em seus modelos.
Aprendizado de máquina (machine learning)
Conforme falamos, quando os dados são “grandes”, eles podem ser usados para construir modelos preditivos que melhor se ajustem aos dados históricos. Em contraste, quando os dados são pequenos, uma abordagem melhor pode ser usar o aprendizado de máquina para identificar anomalias e exceções dos dados históricos.
O aprendizado de máquina é um ramo da inteligência artificial (IA) que usa algoritmos para “aprender” a partir dos dados. Esses algoritmos podem então aplicar esse conhecimento a novas situações ou conjuntos de dados com pouca entrada humana necessária. O aprendizado de máquina depende de grandes quantidades de dados para fins de treinamento.
Aprendizagem por transferência
A aprendizagem por transferência também é conhecida como ajuste fino. É útil em ambientes onde você tem um pequeno número de pontos de dados para a tarefa de interesse, mas um grande número de pontos de dados relacionados a um problema. Basicamente, você primeiro treina um modelo usando um conjunto de big data e, em seguida, treina-o novamente usando um conjunto de dados relacionado menor.
Embora o aprendizado de transferência esteja ganhando terreno no aprendizado de máquina, ele ainda não recebeu muita atenção. Embora o aprendizado de máquina e os cientistas de dados possam estar familiarizados com ele neste ponto, a existência de técnicas como o aprendizado por transferência não parece ter alcançado a consciência dos formuladores de políticas.
Conclusão
O conceito de big data é frequentemente usado para descrever as enormes quantidades de informações coletadas pelas empresas hoje. Embora seja verdade que “big data” pode render insights valiosos, não se esqueça dos conjuntos de dados menores. Esses conjuntos de dados menores são igualmente importantes para o sucesso da sua empresa e podem ajudá-lo a atingir seus objetivos mais rápido do que você imaginava.
Veja mais detalhes no artigo realizado pela Scientific American.