O que você está começando a ler, exatamente nesse momento, você acha que foi escrito por uma pessoa real?

Talvez sim. Talvez não. Hoje em dia, milhares de textos e artigos estão sendo produzidos não por pessoas, mas por algoritmos. É possível que até você já suspeitasse que informações divulgadas sem interrupção (24/7), não poderiam mesmo ser todas escritas por redatores e jornalistas.

A multiplicidade dos canais digitais que temos hoje estimula a “fome” dos leitores por conteúdo novo, porém, o esforço dos profissionais já não consegue mais satisfazer essa voracidade. A grande demanda, combinada com a tecnologia cada vez mais sofisticada, está começando a criar uma nova indústria de narrativas automatizadas.

Antes dos algoritmos, talvez fosse impossível escrever 10.000 artigos por dia. Mas, veja o que um sueco conseguiu. Sverker Johansson criou um programa que já escreveu 2,7 milhões de artigos. Ele é o autor que mais contribuiu para a Wikipédia: 8,5% dos artigos que estão lá são contribuições dele. Vale ressaltar que na Wikipédia, metade de todas as edições é feita por robôs.

Mas como um robô pode escrever tantos artigos e de forma coerente?

No caso de Johansson – que é professor de ciências e tem formação em linguística, engenharia civil, economia e física – sua criação, conhecida como Lsjbot, pega informações de várias fontes confiáveis, para em seguida juntar tudo e gerar um texto.

Há outras soluções também. Vamos falar neste artigo, das duas principais que temos hoje no mercado.

Wordsmith, da Automated Insights

This is where the magic happens.

Escritório da Automated Insights, com o CEO Robbie Allen ao fundo. (Crédito: Justin Cook)

 

Em junho desse ano, a Associated Press – uma grande agência de notícias americana – anunciou que começou a usar um software para gerar automaticamente notícias sobre esporte. Ela começou a usar o Wordsmith, ferramenta de geração de conteúdo criada por uma empresa americana chamada Automated Insights. Antes, a AP já utilizava o Wordsmith para gerar narrativas em cima de relatórios trimestrais de lucros corporativos.

Mas, será que alguém realmente lê conteúdos gerados por estas máquinas?

O CEO da Insights Automated, Robbie Allen, diz que a empresa gerou mais de um bilhão de peças de conteúdo somente em 2014, e a maior parte não foi dirigida para um público de massa. A Wordsmith age como uma espécie de cientista de dados pessoais, criando relatórios personalizados.

“Nós invertemos o modelo tradicional de criação de conteúdo. Em vez de uma história com um milhão de visualizações de página, vamos ter um milhão de histórias numa página vista por apenas uma pessoa.” Robbie Allen, CEO da Insights Automated.

 

Isso significa que no futuro você poderá ter o seu robô jornalista “particular”, apresentando histórias diárias apenas para você sobre assuntos que apenas lhe interessam como o acompanhamento da sua dieta ou sobre suas finanças pessoais.

Allen teve a ideia desse serviço oito anos atrás, quando trabalhava como engenheiro na Cisco. Ele, que já tinha escrito dez livros, queria criar algo novo, então decidiu combinar sua paixão pela informática, com redação e análise de informações.

Transformando números em palavras

A Automated Insights lançou a versão beta gratuita do Wordsmith que ainda está só em Inglês. Mas, não deve demorar para colocarem em outros idiomas.

O objetivo é ajudar empresas a transformar planilhas e relatórios complexos em textos mais fáceis de entender. Então, o Wordsmith essencialmente faz duas coisas:

Primeiro, ele recebe os dados estruturados (pode ser um monte de dados) e os analisa para encontrar pontos interessantes, os quais não seriam encontrados tão bem se fossem procurados pelos humanos. Em seguida, ele tece esses insights num pedaço de texto que seja entendível para as pessoas.

Em resumo, primeiro, você envia uma planilha ou outra fonte de dados estruturados. O Automated Insights transforma os vários campos da planilha em variáveis ​​que você pode ligar num modelo específico de texto que você cria. Existem muitas regras que podem ser definidas, como por exemplo, a capacidade de usar um conjunto de palavras quando uma variável passa a ser maior do que um determinado número.

Por exemplo, digamos que você esteja trabalhando com uma planilha de dados das vendas trimestrais de sua empresa. Você pode criar um modelo que irá gerar o texto “As vendas aumentaram nos dois trimestres” se o número na célula na planilha com as vendas totais do trimestre for maior do que o número na célula para um trimestre.

Narrative Science

Narrative Science 2
Da esquerda para a direita, Kris Hammond, Larry Birnbaum e Stuart Frankel da Narrative Science.
(Crédito: Peter Wynn Thompson)

 

Enquanto isso, há um concorrente da Automated Insights. Chama-se Narrative Science e fornece serviços similares para a Fortune e Big Ten Network.

A Narrative Science, assim como a Automated Insights, permite que os clientes criem modelos que o software preenche. Cada modelo requer várias etapas. Primeiro, ele deve acumular dados de alta qualidade. É por isso que finanças e esportes são melhores de se trabalhar: ambos envolvem flutuações de números – lucro por ação, perdas e ganhos. As estatísticas estão sempre criando novos dados que podem enriquecer uma narrativa.

Em seguida, os algoritmos devem ter uma compreensão mais ampla do assunto. Por exemplo, eles devem saber que um time com o maior número de “runs” é declarada vencedora num jogo de beisebol.

Para ter essa compreensão, a empresa contratou uma equipe de “meta-escritores,” jornalistas formados, que estão construindo um conjunto de modelos. Eles trabalham com engenheiros para treinar os computadores a identificar vários “ângulos” a partir dos dados disponíveis, seja o lucro das empresas ou um evento esportivo.

Mas como transformar essa análise em prosa?

É aí que vem a estrutura. A maioria das notícias, em particular sobre temas como esportes ou finanças, tem uma fórmula bastante previsível, e por isso é relativamente simples para os meta-escritores criarem uma estrutura para os artigos. Para construir frases, os algoritmos utilizam o vocabulário compilado pelos meta-escritores.

A Narrativa Science também permite que os clientes personalizem o tom das histórias, como por exemplo, optar por um tom bem-educado ou um tom objetivo ou até um tom irreverente.

De notícias para relatórios

Uma vez que a Narrative Science dominou a arte de contar histórias na área de esportes e de finanças, a empresa percebeu que poderia produzir muito mais coisas. Na realidade, eles descobriram que havia demanda de pessoas que estavam afogadas em planilhas e gráficos. Eles descobriram que essas pessoas pagariam para converter toda a montanha de informações confusas em dois parágrafos que levasse aos pontos-chave.

A Narrative Science já estava preparada para absorver essas demandas, pois os meta-escritores já tinham educado meticulosamente o sistema toda vez que fosse abordado um assunto novo. Em pouco tempo, eles desenvolveram uma plataforma que tornou mais fácil para o algoritmo aprender sobre novos assuntos.

Por exemplo, uma das meta-escritores decidiu customizar o software de forma que fosse capaz de produzir artigos sobre os melhores restaurantes em uma determinada cidade. Usando um banco de dados de resenhas de restaurantes, ela foi capaz de ensinar rapidamente o software a identificar componentes relevantes (como um bom serviço, uma comida deliciosa, uma citação de um cliente feliz) e gerar algumas frases relevantes. Em pouco tempo, ela tinha um “robô” que podia gerar infinitamente pequenos artigos como por exemplo “O Melhor Restaurante Italiano em Atlanta“.

E assim, os assuntos foram ficando cada vez mais diversificados. Como exemplo, a Narrative Science foi contratada por uma rede de fast-food para escrever um relatório mensal para seus franqueados analisando números de vendas, comparando aos seus pares regionais, e sugerindo itens de menu específicos para cada um deles.

Hoje, a empresa está produzindo 401 mil relatórios personalizados. O baixo custo de transformar dados em histórias torna prático escrever, mesmo que para uma audiência de apenas uma pessoa.

Porém, por enquanto, o jornalismo continua a ser o principal foco da empresa e, como todo jornalista, ela sonha um dia descobrir um furo e fazer uma grande matéria. Mas, para isso terá que investir em tecnologias de aprendizado de máquina (machine learning) e mineração de dados sofisticados. Também terá de se aprofundar em compreensão da linguagem natural. O mais provável é que à medida que a Narrative Science evolua, suas histórias também evoluam de notícias “commodities” para um jornalismo explicativo.

O futuro dos redatores e jornalistas

Automated insights 1

Kristian Hammond, co-fundador da Narrative Science, acredita que o que se tem hoje é apenas o primeiro passo em direção a um universo dominado por notícias e histórias geradas pelos computadores. No ano passado em uma pequena conferência com jornalistas e tecnólogos, Hammond previu qual seria o percentual de notícias escritas por computadores em 15 anos. No começo, ele tentou se esquivar da pergunta, mas com alguma insistência, ele suspirou e cedeu: “Mais de 90%

E recentemente, Hammond foi questionado se havia uma previsão de que um computador pudesse ganhar o Prêmio Pulitzer nos próximos 20 anos. Ele discordou. “Isso irá acontecer em 5 anos“, disse ele.

Mas, Hammond garante que não há nada com o que se preocupar. Estes robôs não vão tirar o emprego dos redatores e jornalistas humanos. Em vez disso, o universo do copywriting, newswriting e storytelling irá expandir dramaticamente, com a ajuda dos computadores que criará textos sobre uma infinidade de eventos e tendências que nenhum jornalista está cobrindo.

Ele acredita que talvez, em algum momento no futuro, os seres humanos e os algoritmos irão colaborar mutuamente, cada um com a sua força. O computador, com a sua memória infalível e sua enorme capacidade de acessar e processar dados, pode ajudar os escritores humanos. Ou vice-versa, os redatores e repórteres humanos podem entrevistar, captar detalhes e em seguida, enviá-los para um computador que processa tudo.

À medida que os computadores ficam mais afiados e têm acesso a mais e mais dados, eles irão superar as suas próprias limitações. Pode levar um tempo, mas até mesmo um artigo como esse que você acabou de ler poderia ter sido produzido por eles. Em 20 anos, não haverá nenhuma área em que estes softwares não dominem.

 

O Futuro das Coisas

Somos um ecossistema de futuros e inovação que atua para desenvolver pessoas, times e lideranças, por meio de educação e cultura de aprendizagem, conteúdo de impacto e estudos de futuros.

Ver todos os artigos