Tether lança a primeira "framework de treinamento de IA em escala de mil milhões" global para dispositivos móveis, iPhone e Samsung conseguem executar LoRA

Tether, a empresa-mãe de dados e IA, a QVAC, anunciou em 17 de março uma grande inovação tecnológica, lançando a primeira estrutura de ajuste fino LoRA (Low-Rank Adaptation) multiplataforma que suporta a arquitetura BitNet (LLM de 1-bit) da Microsoft. Essa tecnologia integrada ao QVAC Fabric reduz drasticamente os requisitos de memória e processamento, tornando modelos com bilhões de parâmetros acessíveis além do ambiente de GPU empresarial, possibilitando o treinamento “local e totalmente privado” em smartphones e laptops comuns.
(Prévia: Tether investe na Axiym para ampliar sua infraestrutura de pagamento: impulsionando a integração do USDT em redes de pagamento globais e reguladas)
(Complemento: Tether investe na interseção entre IA e tecnologia do sono! Liderando um aporte de 50 milhões de dólares na Eight Sleep, elevando sua avaliação para 1,5 bilhão de dólares)

Índice do artigo

Alternar

  • O poder da arquitetura de 1-bit: fazer o desempenho do celular “render mais com menos”
  • Dados de testes reais: velocidade surpreendente do Samsung S25 e do iPhone 16
  • Adeus às chaves API, criando uma IA pessoal 100% privada

No campo da inteligência artificial (IA), treinar modelos poderosos sempre foi considerado um “gasto de dinheiro”, altamente dependente de sistemas caros da NVIDIA ou de computação em nuvem. No entanto, o gigante das stablecoins, Tether, tenta reescrever essa regra com tecnologia própria. Em 17 de março, a equipe técnica da Tether, a “Tether Data”, anunciou o lançamento do primeiro framework de ajuste fino LoRA multiplataforma para sua plataforma QVAC (QuantumVerse Automatic Computer).

O valor central dessa inovação é: ela permite que modelos de IA com “bilhões de parâmetros” possam aprender de forma personalizada diretamente nos smartphones de cada usuário.

O poder da arquitetura de 1-bit: fazer o desempenho do celular “render mais com menos”

Esse avanço revolucionário é baseado na arquitetura BitNet de LLM de 1-bit, desenvolvida pela Microsoft. Com a otimização do QVAC Fabric, o uso de memória e a carga de processamento do modelo BitNet foram reduzidos a níveis extremamente baixos. Segundo o anúncio, essa estrutura não só suporta GPUs NVIDIA comuns, mas também é compatível com chips Intel, AMD, Apple M-series, além de GPUs móveis como Adreno (Android), Mali e Apple Bionic.

Isso significa que, ao contrário do que era possível apenas em centros de dados, agora é possível fazer ajuste fino de IA “LoRA” em smartphones. A Tether afirma que essa tecnologia permite que dispositivos de borda processem modelos com o dobro do tamanho de modelos quantizados Q4 tradicionais, demonstrando uma vantagem de memória sem precedentes.

Dados de testes reais: velocidade surpreendente do Samsung S25 e do iPhone 16

A equipe da Tether compartilhou dados de testes empolgantes, demonstrando a capacidade prática dessa estrutura em smartphones modernos:

  • Modelo de 125 milhões de parâmetros: ajustado em um conjunto de dados com 300 documentos biomédicos no Samsung S25, em cerca de 10 minutos.
  • Modelo de 1 bilhão (1B) de parâmetros: completou o mesmo ajuste em 1 hora e 18 minutos no Samsung S25 e em 1 hora e 45 minutos no iPhone 16.
  • Desafio extremo: a equipe conseguiu rodar um modelo de até 13 bilhões (13B) de parâmetros no iPhone 16 para ajuste fino, levando a IA móvel ao limite físico do dispositivo.

Adeus às chaves API, criando uma IA pessoal 100% privada

O CEO da Tether, Paolo Ardoino, sempre enfatizou: “Se você precisa de uma chave API para usar IA, ela não é realmente sua.” A filosofia central do QVAC é “prioridade ao local (Local-first)”.

Com o framework LoRA de BitNet, os usuários podem fazer com que a IA aprenda diretamente de seus e-mails, notas e mensagens locais, sem precisar enviar qualquer dado para servidores na nuvem. Isso elimina preocupações sobre o uso indevido de dados sensíveis por empresas e rompe com o monopólio de poucos gigantes no desenvolvimento de IA. Atualmente, o QVAC Fabric LLM está disponível como software de código aberto (licença Apache 2.0) e oferece adaptadores pré-configurados na Hugging Face, permitindo que desenvolvedores ao redor do mundo iniciem imediatamente essa revolução na computação de borda.

Ver original
Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.
Comentar
0/400
Nenhum comentário