Você já deve ter experimentado vários aplicativos de IA generativos em seu telefone. O ChatGPT ou o HeyPi da OpenAI são alguns exemplos de aplicativos de IA falador, enquanto o Runway ML permite que você crie vídeos gerados por IA diretamente no seu telefone.
Mas, até agora, quase todos os aplicativos de IA generativa contam com computação baseada em nuvem, o que significa que todo o processamento mágico de IA acontece na nuvem, da mesma forma que os kits do Xbox fazem o trabalho pesado nos centros de servidores da Microsoft quando você transmite um jogo de console em seu computador. telefone ou tablet.
A MediaTek quer mudar isso, permitindo a computação de IA generativa no dispositivo, diretamente no seu smartphone. Esse ambicioso projeto lunar se materializará com o próximo chipset principal da MediaTek, que aparecerá nos telefones Android até o final deste ano. A empresa é auxiliada em seus esforços pela Meta, controladora do Facebook, que oferece o modelo Llama 2 como pedra fundamental para aplicativos de IA generativos.
A fabricante de chips está divulgando toda uma gama de benefícios de sua abordagem de processamento de IA generativa no dispositivo, que inclui “desempenho contínuo, maior privacidade, melhor segurança e confiabilidade, menor latência, capacidade de trabalhar em áreas com pouca ou nenhuma conectividade e menor custo de operação.”
Acelerando a IA generativa em telefones
O próximo chip MediaTek topo de linha empregará três táticas principais para aprimorar a experiência de IA generativa para smartphones. Primeiro, contará com uma pilha de software dedicada otimizada para executar Llama 2, um modelo de linguagem grande de código aberto desenvolvido pela Meta que busca desafiar os modelos GPT da OpenAI e PaLM 2 do Google.
Lhama 2, que foi lançado em julho, é “gratuito para pesquisa e uso comercial”. Até agora, não chegaram muitos aplicativos que dependem do modelo de linguagem Llama 2, já que os aplicativos de IA baseados em GPT são atualmente o assunto da cidade. Mas a Meta tem solicitado ativamente participantes da indústria de smartphones, incluindo a arquirrival da MediaTek, a Qualcomm.
Assim como a MediaTek, a Qualcomm também assinou um negócio com a Meta para mostrar o processamento no dispositivo para aplicativos baseados em Llama em smartphones alimentados por seus principais chips a partir de 2024. Ambas as empresas também têm como alvo outras áreas de aplicação, como veículos. Hardware XR, dispositivos domésticos inteligentes e muito mais, com seus esforços de IA generativa local de dispositivo facilitados por silício de primeira linha.
Em seu próximo chip principal compatível com IA, a MediaTek também usará uma APU (unidade de processamento de IA) aprimorada que depende da “aceleração do backbone do transformador”. Transformers são um tipo de arquitetura de rede neural encarregada de criar grandes modelos de linguagem, como GPT (Generative Pre-Trained Transformers), que deu origem a produtos como ChatGPT e Bing Chat da Microsoft.
Finalmente, o novo chip da MediaTek também mergulhará no módulo DRAM para aprimorar a experiência do usuário em aplicativos de IA generativos baseados em Llama. DRAM, abreviação de Dynamic Random Memory, é o módulo de memória de alta velocidade e baixa latência que armazena os dados de trabalho de um aplicativo. Quanto mais DRAM houver no seu telefone, maior será o número de aplicativos que você pode executar em segundo plano sem problemas. Há uma razão pela qual fabricantes de smartphones como o OnePlus instalaram até 24 GB de DRAM em seus telefones.
O que essas atualizações de IA significam para você
Com os ajustes mencionados acima, a MediaTek diz que seu próximo chip de IA aprimorará a experiência de LLM e AIGC (Artificial Intelligence-Generated Content), transferindo a maior parte dos requisitos de processamento para o hardware local.
Quanto ao tipo de tarefas que você pode esperar acelerar, bem, isso dependeria dos recursos do modelo Llama 2 da Meta e do tipo de aplicativos criados sobre ele. Llama 2 é um modelo de linguagem natural baseado em texto, então você pode esperar que ele use os mesmos tipos de truques que ChatGPT ou Bard. Ele pode processar consultas e fornecer respostas com base em seus conjuntos de dados de treinamento, resumir ou expandir textos e muito mais.
Quanto à MediaTek, esta não será a primeira parceria de IA desse tipo. Em julho deste ano, a empresa fechou um acordo com o braço chinês da Unity – que desenvolve o mecanismo de desenvolvimento de jogos homônimo – para explorar aplicativos generativos de IA no segmento de jogos.
A MediaTek espera que seu novo chip com aplicativos Llama 2 chegue aos smartphones até o final do ano, então não temos que muito mais tempo para esperar para ver como tudo isso fica em um produto real.
Recomendações dos editores