Deepseek da China acusado de desenvolvimento ilegal de IA
Openai suspeita que os modelos Deepseek AI da China, significativamente mais baratos que os colegas ocidentais, podem ter sido desenvolvidos usando os dados do OpenAI. Essa revelação, juntamente com o rápido aumento da popularidade da Deepseek, desencadeou um declínio acentuado nos preços das ações das principais empresas focadas na IA, principalmente a NVIDIA, que sofreu sua maior perda de um dia.
O modelo R1 da DeepSeek, construído sobre o Deepseek-V3 de código aberto, possui custos de treinamento drasticamente reduzidos (estimados em US $ 6 milhões) e requisitos computacionais em comparação com modelos ocidentais como o ChatGPT. Embora a precisão dessas reivindicações seja debatida, a mera sugestão abalou a confiança dos investidores nos enormes investimentos feitos pelos gigantes da American Tech em IA.
O OpenAI e a Microsoft estão investigando se Deepseek violou os termos de serviço da OpenAI, empregando "destilação", uma técnica que extrai dados de modelos maiores para treinar os menores. A OpenAI confirmou sua conscientização sobre tais tentativas dos chineses e de outras empresas de replicar os modelos de IA nos EUA e declarou seu compromisso de proteger sua propriedade intelectual. David Sacks, o czar da AI do presidente Donald Trump, corroborou essas preocupações, sugerindo que as contramedidas provavelmente serão implementadas pelas principais empresas de IA.
A situação destaca uma ironia significativa: o Openai, acusado de utilizar material protegido por direitos autorais sem permissão na criação do ChatGPT, agora está acusando a Deepseek de práticas semelhantes. Essa hipocrisia tem sido amplamente observada, particularmente à luz das declarações anteriores da Openai à Câmara dos Lordes do Reino Unido e à sua batalha legal em andamento com o New York Times por suposta violação de direitos autorais. A defesa do Openai se baseia no argumento de que o treinamento de modelos de IA sem acesso a material protegido por direitos autorais é praticamente impossível, uma alegação que foi desafiada por inúmeros processos de autores e editores. O cenário legal em torno dos dados de treinamento da IA permanece altamente contestado, com debates contínuos sobre uso justo e as implicações mais amplas da lei de direitos autorais na era da IA generativa.
Artigos mais recentes