top of page
6 peças em aço inoxidável (16).png

Entre para o Clube do Consumo Inteligente
Ganhe um incrível presentes de boas-vindas, além de uma série de benefícios!

Deepseek impressionou : entenda o motivo

  • Foto do escritor: Redação
    Redação
  • 31 de jan.
  • 5 min de leitura

Pesquisador brasileiro diz que Deepseek foi feito de uma forma diferente das outras empresas de tecnologia


Deepseek impressionou

O chatbot de inteligência artificial chinês DeepSeek-R1 foi lançado de maneira discreta em 20 de janeiro de 2025. Apenas dois dias depois, a equipe responsável pela plataforma divulgou um relatório técnico de 22 páginas, onde avaliava o desempenho do sistema e o comparava aos concorrentes americanos, como o ChatGPT da OpenAI e o Claude da Anthropic.


Inicialmente, a reação do mundo da tecnologia foi de ceticismo. Muitos se perguntaram se as informações apresentadas eram realmente verdadeiras ou apenas uma propaganda do governo chinês. No entanto, o ceticismo foi rapidamente superado conforme especialistas começaram a testar o modelo e a entender sua construção, reconhecendo que ele realmente competia com as grandes empresas de tecnologia dos EUA, exacerbando a disputa entre os dois países pela liderança tecnológica.


Contudo, surgiram questionamentos sobre os investimentos: muitos acreditavam que os US$ 5,5 milhões anunciados como gastos para treinar o modelo eram subestimados e que o número de chips utilizados no projeto era superior aos dois mil mencionados pela empresa.


Em 29 de janeiro, a OpenAI alegou que o DeepSeek havia utilizado dados do ChatGPT para treinar seu chatbot, mas não forneceu mais detalhes sobre essa afirmação. Também chamou a atenção a autocensura do DeepSeek, que evita responder perguntas sobre temas sensíveis sob a perspectiva do Partido Comunista Chinês, como "O que foi o massacre da Praça da Paz Celestial?", frequentemente desviando o assunto com respostas do tipo "Desculpe, isso está além do meu escopo atual. Vamos falar de outra coisa."


Apesar da tensão no cenário dos negócios e da geopolítica, a inovação trazida pelo DeepSeek impressionou a comunidade científica, segundo o pesquisador brasileiro Cleber Zanchettin. Embora tenha sido comparado ao ChatGPT em termos de experiência do usuário, o DeepSeek se distingue do concorrente americano em vários aspectos.


Zanchettin, professor do Centro de Informática da Universidade Federal de Pernambuco (CIn-UFPE) e um dos líderes em pesquisa em inteligência artificial na América Latina, explicou à BBC News Brasil quatro características que tornam o DeepSeek notável. A primeira delas é o fato de ser um modelo de código aberto. "Eles compartilharam informações que não foram divulgadas por outros fabricantes", destacou o professor.


Até então, os modelos de linguagem de grande escala (LLMs) normalmente eram de código fechado, como o ChatGPT e o Claude, ou apresentavam alguns parâmetros abertos, como o LLaMA, da Meta. No caso do DeepSeek, segundo Zanchettin, houve um avanço significativo, já que os desenvolvedores divulgaram detalhes sobre como treinar o modelo, algo que costuma ser protegido rigorosamente até mesmo por aqueles que disponibilizam modelos com pesos abertos.


Além disso, antes do lançamento do DeepSeek, os pesquisadores não tinham uma compreensão clara do raciocínio em modelos mais avançados de inteligência artificial. O professor destaca também o mecanismo que detalha o passo a passo do raciocínio nas respostas do DeepSeek quando a função "DeepThink" está ativada.


"A maioria das empresas não queria que entendêssemos completamente como seus modelos raciocinam, porque isso poderia revelar se estão funcionando corretamente ou se os resultados são aleatórios", argumenta Zanchettin.


Em um teste realizado pela reportagem com uma questão de matemática da segunda fase do vestibular do Instituto Tecnológico da Aeronáutica (ITA) de 2024, o DeepSeek explorou várias abordagens até chegar à resposta correta, usando expressões como "Calma", "Espere aí", e "Vamos nessa direção". Esse vislumbre do processo de raciocínio é valioso para os especialistas, pois ajuda a entender melhor a robustez e as habilidades do modelo.


"Essa é uma informação bastante relevante sobre como o modelo toma decisões," concluiu Zanchettin.

Outra novidade surpreendente foi o método utilizado para desenvolver e treinar a plataforma.


Até agora, os modelos de inteligência artificial fechados exigiam uma grande intervenção humana, uma abordagem conhecida como "humano no loop" (HITL, na sigla em inglês), que era especialmente utilizada nas etapas de ajuste fino. Por outro lado, o DeepSeek depende "muito menos" da supervisão humana, adotando uma estratégia centrada no aprendizado por reforço. Nesse modelo, o sistema é treinado com base em recompensas: ele recebe um retorno positivo, por exemplo, sempre que fornece a resposta correta a um problema matemático, o que permite que aprenda a "raciocinar" de maneira cada vez mais eficiente e, como resultado, melhore a qualidade de suas respostas.


No relatório técnico divulgado em 22 de janeiro, a equipe mencionou que perceber o sucesso da abordagem de auto-evolução foi como um "aha moment", ou um verdadeiro "momento Eureka".


"Isso não apenas tornou o processo mais interessante, mas também mais econômico em termos computacionais", afirma Zanchettin.


Ele observa que isso pode indicar uma mudança de paradigma significativa. Com a redução da necessidade de investimentos bilionários, mais players têm a oportunidade de competir na busca por inovações em inteligência artificial, incluindo brasileiros.


O pesquisador, que foi professor visitante na Northwestern University, ressalta que, mesmo nos Estados Unidos, grupos de pesquisa e startups com recursos limitados têm dificuldade em competir com as grandes empresas de tecnologia, que utilizam uma abordagem de "força bruta" em sistemas de inteligência artificial: "Quanto mais recursos você possui, mais hardware consegue adquirir, mais dados pode utilizar para treinar o modelo e, consequentemente, melhor será o desempenho do modelo."


As inovações de baixo custo proporcionadas pelo DeepSeek "trazem muitos talentos de volta ao cenário, possibilitando que inovem em nível semelhante", acredita ele.


"Isso irá abrir portas não apenas para a academia, mas também para a indústria e para a sociedade como um todo, que será inundada com inovações a um custo menor."


Outra inovação é a aprendizagem por reforço que a DeepSeek trouxe para o cenário da inteligência artificial.


"Há diversos avanços tecnológicos, do ponto de vista da engenharia, que eles conseguiram integrar de maneira eficaz, algo que não havíamos conseguido até agora. Esse foi um grande diferencial", afirma o professor.


Esse feito é ainda mais impressionante porque foi alcançado sem os melhores chips disponíveis, uma vez que, em 2022, os Estados Unidos impuseram restrições à importação de chips de última geração pela China, com o objetivo de conter o avanço chinês nessa área devido a preocupações de segurança.


"No Brasil, sempre enfrentamos diversas dificuldades e temos o mantra de que a dificuldade gera oportunidades, que a inovação surge da limitação. A China agora provou essa teoria", completa.


Antes do lançamento do DeepSeek, muitos no Ocidente acreditavam que a China estava muito atrás dos Estados Unidos em inteligência artificial avançada. Desde a introdução do ChatGPT em 2022, as grandes tecnologias americanas têm lançado suas plataformas de IA generativa com algum sucesso, como o Claude, da Anthropic, e o Gemini, do Google.


Embora empresas chinesas como Baidu, Tencent e ByteDance – dona do TikTok – tenham lançado modelos de IA, esses não foram considerados comparáveis ao ChatGPT.


O DeepSeek altera o panorama e intensifica a disputa entre China e Estados Unidos pela liderança tecnológica no século 21. Poucos dias após o lançamento do DeepSeek, a Alibaba também apresentou seu próprio modelo de IA, afirmando que ele superava o da DeepSeek.


Para o pesquisador brasileiro, essa rivalidade entre chatbots é apenas uma pequena parte das ambições mais amplas dos dois países na área de inteligência artificial, um aspecto que talvez nem seja tão relevante para suas estratégias.


Ele ressalta que a IA possui aplicações em setores militares e em áreas tão diversas quanto robótica, veículos autônomos, sistemas de comunicação e saúde.


Fonte : BBC.com

Comments


Siga nossos perfis nas redes sociais!
Conteúdos úteis e relevantes para você consumir de forma inteligente

  • Instagram
  • Facebook
Somos Consumidores (7).gif
Imagem do WhatsApp de 2025-05-22 à(s) 10.03_edited.jpg
bottom of page