O trabalho da Apple em integrações avançadas de inteligência artificial em seus produtos continua a acelerar, com um artigo recém-publicado de suas equipes de pesquisa revelando o trabalho do fabricante do iPhone no MM1, um conjunto de modelos multimodais de grandes linguagens.
O jornal, intitulado ‘MM1: Métodos, análises e insights do pré-treinamento multimodal LLM‘discute “construir modelos multimodais de grande linguagem (MLLMs) de alto desempenho” e como “o pré-treinamento usando uma mistura cuidadosa de legenda de imagem, texto de imagem intercalado e dados somente de texto é crucial para alcançar o estado da arte resultados de poucas tentativas em vários benchmarks, em comparação com outros resultados de pré-treinamento publicados.”
É um artigo bastante cheio de jargões, mas em sua essência descreve como modelos multimodais de grandes linguagens podem produzir fluxos de trabalho mais avançados e precisos para aplicações de IA, extraindo de vários conjuntos de dados de uma só vez – não apenas texto, mas também imagens, bem como potencialmente fontes de áudio e vídeo.
O MM1 é capaz de interpretar informações em 30 bilhões de parâmetros e, como resultado, pode
“alcançar desempenho competitivo após ajuste supervisionado em uma série de benchmarks multimodais estabelecidos.” Os pesquisadores chamam o MLLM de “a próxima fronteira em modelos básicos”, com “capacidades superiores” aos grandes modelos de linguagem que alimentaram a onda revolucionária de ferramentas de IA nos últimos meses e anos.
As ambições de IA da Apple
No entanto, o MM1 permanece a portas fechadas por enquanto, e não há garantia de que algum dia se transformará em um produto voltado para o consumidor, mesmo que as lições aprendidas com ele cheguem a outras aplicações de IA.
Atualmente, sabemos que a Apple está duplicando seus planos de IA, seguindo pressão dos acionistas que pode ter inadvertidamente levado ao cancelamento de seu projeto de carro Apple sem motorista. Em resposta à agitação dos acionistas, O CEO Tim Cook afirmou que a Apple irá “abrir novos caminhos” em IA, abrindo “oportunidades transformadoras” para os usuários.
Seus esforços até agora se concentram em um esforço de pesquisa e desenvolvimento de US$ 1 bilhão para um grande modelo de linguagem chamado Ajax, com a empresa também comprando uma startup canadense de inteligência artificial chamada DarwinAI.
A Apple, pelo menos no sentido público, está tentando alcançar concorrentes como Google e Microsoft, que já estão implementando suas respectivas ferramentas Gemini e CoPilot AI em produtos de consumo. O iOS 18, previsto para ser revelado na WWDC 2024, provavelmente será a plataforma onde a Apple abre a cortina de seus principais esforços de IA até agora, embora a empresa tenha feito questão de enfatizar que seus produtos (por meio de seus elementos de chip Neural Engine) são já fazendo uso de princípios de inteligência artificial. Está chamando de recente MacBook Air M3 lançar “o melhor laptop de consumo do mundo para IA”.