A batalha da rotulagem de dados de IA: da competição de poder de computação à competição de qualidade

robot
Geração do resumo em andamento

A batalha de anotação de dados na indústria de IA: da competição de poder de computação à competição de qualidade de dados

Recentemente, ocorreu um grande evento no campo da inteligência artificial: uma conhecida empresa de redes sociais investiu 14,8 bilhões de dólares para adquirir quase metade da participação da empresa de rotulagem de dados Scale AI. Esta ação gerou um enorme impacto no Vale do Silício, levando as pessoas a se perguntarem: por que a rotulagem de dados de repente se tornou tão valiosa?

Enquanto isso, outro projeto de blockchain que irá lançar um token, o SaharaLabsAI, ainda enfrenta críticas sobre "conceitos de especulação e falta de substância". Que fatores-chave o mercado realmente ignorou por trás desse contraste tão marcante?

Em primeiro lugar, precisamos reconhecer que a rotulagem de dados tem mais valor e potencial do que a agregação de poder de computação distribuído. Embora a história de desafiar grandes provedores de serviços de computação em nuvem utilizando recursos de GPU ociosos pareça atraente, na realidade, o poder de computação é essencialmente uma mercadoria padronizada, com as principais diferenças residindo no preço e na disponibilidade. A vantagem de preço pode parecer permitir encontrar espaço de sobrevivência na monopolização dos gigantes, mas a disponibilidade é limitada por fatores como localização geográfica, latência da rede e nível de participação dos usuários. Assim que grandes empresas reduzirem os preços ou aumentarem a oferta, essa vantagem desaparecerá rapidamente.

Em comparação, a anotação de dados é um campo diferenciado que requer inteligência humana e julgamento profissional. Cada anotação de alta qualidade incorpora conhecimentos especializados, contextos culturais e experiências cognitivas únicas, que não podem ser simplesmente padronizadas e replicadas como o Poder de computação de uma GPU. Por exemplo, uma anotação precisa de diagnóstico de imagem de câncer requer a intuição profissional de um oncologista experiente; uma análise profunda do sentimento do mercado financeiro não pode prescindir da experiência prática de um trader experiente. Essa escassez natural e irreplicabilidade conferem à anotação de dados uma vantagem competitiva incomparável em relação ao poder de computação.

Recentemente, uma grande empresa de tecnologia anunciou oficialmente a aquisição de 49% da empresa de rotulagem de dados Scale AI por 14,8 bilhões de dólares, o maior investimento único na área de IA este ano. Mais interessante é que o jovem fundador e CEO da Scale AI assumirá também a liderança do recém-criado laboratório de pesquisa "Super Inteligência" da gigante da tecnologia.

Este empresário de apenas 25 anos fundou a Scale AI em 2016, enquanto era um estudante desistente da Universidade de Stanford, e hoje a empresa que lidera está avaliada em 30 mil milhões de dólares. A lista de clientes da Scale AI é considerada uma "formação de estrelas" no campo da IA: inclui várias instituições de pesquisa em IA renomadas, fabricantes de automóveis, gigantes da tecnologia e departamentos governamentais. A empresa é especializada em fornecer serviços de anotação de dados de alta qualidade para o treinamento de modelos de IA, contando com mais de 300 mil anotadores treinados profissionalmente.

Enquanto a maioria das pessoas ainda debate qual empresa tem o modelo de IA mais eficiente, os verdadeiros líderes do setor já transferiram silenciosamente o campo de batalha para a fonte de dados. Uma "guerra secreta" pela dominância futura da IA já começou.

O sucesso da Scale AI revela um fato negligenciado: na fase atual, o poder de computação já não é um recurso escasso, a arquitetura dos modelos também tende à homogeneização, e o que realmente determina o teto da inteligência da IA são os dados de alta qualidade que foram cuidadosamente processados. As grandes empresas de tecnologia não estão apenas adquirindo uma empresa de terceirização, mas sim os "direitos de exploração do petróleo" da era da IA.

No entanto, o monopólio sempre provoca resistência. Assim como as plataformas de poder de computação distribuído tentam derrubar os serviços de computação em nuvem centralizados, a Sahara AI está tentando reestruturar completamente as regras de distribuição de valor da rotulagem de dados usando tecnologia blockchain. O problema central do modelo tradicional de rotulagem de dados não está na tecnologia, mas sim nas falhas do design do mecanismo de incentivo.

Tomemos como exemplo o setor médico, um médico pode passar horas a rotular imagens médicas, mas só recebe uma remuneração ínfima, enquanto o modelo de IA treinado com esses dados pode valer bilhões de dólares, e o médico não consegue compartilhar os lucros. Este modelo de distribuição de valor extremamente injusto inibe significativamente a disposição para fornecer dados de alta qualidade.

E com o suporte da tecnologia blockchain e da economia de tokens, os anotadores de dados deixaram de ser "trabalhadores de dados" baratos e tornaram-se os verdadeiros "acionistas" da rede de modelos de linguagem AI. É evidente que a vantagem da tecnologia Web3 na transformação das relações de produção é mais aplicável ao cenário de anotação de dados do que na área do Poder de computação.

Curiosamente, a Sahara AI estava prestes a emitir tokens exatamente no momento em que esta grande empresa de tecnologia anunciou uma aquisição a preço exorbitante. Isso é uma coincidência ou um arranjo meticulosamente planejado? Na minha opinião, isso reflete um ponto de viragem importante no mercado: tanto as empresas de tecnologia tradicionais quanto os projetos de blockchain já passaram da fase de "competição de poder de computação" para uma nova fase de "competição pela qualidade dos dados".

Quando os gigantes tradicionais tentam construir barreiras de dados com a vantagem do capital, o campo do Web3 está explorando um experimento de "democratização dos dados" mais inclusivo através da economia de tokens. O resultado desta guerra de rotulagem de dados provavelmente determinará a direção futura do desenvolvimento da tecnologia de IA.

SAHARA1.98%
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • 6
  • Repostar
  • Compartilhar
Comentário
0/400
SellTheBouncevip
· 13m atrás
Outra onda de projetos para fazer as pessoas de parvas... esperar cair até ao fundo
Ver originalResponder0
rug_connoisseurvip
· 15h atrás
148 bilhões só isso?
Ver originalResponder0
MetamaskMechanicvip
· 15h atrás
Fritar até 14,8 bilhões de dólares. É mesmo possível marcar dados?
Ver originalResponder0
SellLowExpertvip
· 15h atrás
Ai 14,8 bilhões, o que comprar não é bom, comprar isso.
Ver originalResponder0
GreenCandleCollectorvip
· 15h atrás
14.8 bilhões? Estão ficando loucos?
Ver originalResponder0
MagicBeanvip
· 15h atrás
Negociação de criptomoedas negociou muito e agora vem negociar ai. Ai.
Ver originalResponder0
Faça trade de criptomoedas em qualquer lugar e a qualquer hora
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)