China está usando chips e supercomputadores domésticos para treinar AI


A China está avançando na alavancagem de supercomputadores e chips de inteligência artificial domésticos para o treinamento de dados de IA, enquanto lida com as restrições impostas pelos Estados Unidos às exportações dos chips de IA mais avançados da empresa norte-americana Nvidia para o país, disseram especialistas e executivos de empresas.

Esses comentários surgiram depois que a China Mobile anunciou no domingo que seu centro de computação de IA, o maior do tipo entre os operadores globais de telecomunicações, entrou em operação em Hohhot, na região autônoma da Mongólia Interior, e mais de 85% dos chips de IA usados no centro são domésticos.

Zheng Weimin, acadêmico da Academia Chinesa de Engenharia, disse ao China Daily que a China possui até o momento 14 centros de supercomputadores de nível nacional.

Através do design coordenado de hardware e software, esses recursos podem ser aproveitados para o treinamento e inferência de dados para modelos de linguagem grandes, uma tecnologia chave por trás de aplicações de IA generativa como o ChatGPT, disse ele.

Uma equipe liderada por Zheng conduziu o treinamento de IA em dois grandes modelos de linguagem, como o LLAMA 7B, usando um supercomputador desenvolvido domesticamente. O treinamento “obteve resultados alinhados com os da formação em plataformas de chips da Nvidia, mas com apenas um sexto do custo de alugar chips da Nvidia”, disse Zheng.

As observações surgiram enquanto os preços dos chips de IA mais avançados da Nvidia disparavam na China após os EUA apertarem as restrições de exportação.

Kang Bo, chefe do departamento de inteligência de dados do Centro Nacional de Supercomputação de Tianjin, disse ao China Daily que “os supercomputadores domésticos têm uma vantagem de custo em termos de uso, à medida que o consumo de energia e os preços dos chips da Nvidia se tornam muito altos”.

O centro de supercomputadores em Tianjin lançou um grande modelo de linguagem interno, Tianhe Tianyuan, em maio passado, aproveitando seu poder de supercomputação. O centro é conhecido por desenvolver e implantar os supercomputadores de maior classificação da China, incluindo o mundialmente conhecido Tianhe-1, disse Kang.

“Nosso supercomputador pode lidar tanto com cálculos científicos quanto com computação de IA, incluindo raciocínio preciso. Podemos utilizar este sistema de supercomputação integrado para realizar tarefas que anteriormente exigiam múltiplos sistemas para alternar entre eles. Esta é a nossa vantagem,” acrescentou.

O Ministério da Ciência e Tecnologia concedeu ao centro permissão para estabelecer uma plataforma nacional de inovação aberta de computação pública para IA de próxima geração, para expandir sua cooperação com mais partes, disse Kang.

No início deste mês, o centro disse ter encontrado parceiros para promover a aplicação do Tianhe Tianyuan em indústrias como pesquisa médica, segurança pública, alfândega e proteção ambiental.

Kang disse que, com base no Tianhe Tianyuan, o centro desenvolveu um “cérebro de IA hospitalar” em colaboração com parceiros, que pode ajudar os médicos a avaliar doenças e fornecer recomendações de tratamento.

Além de aproveitar os supercomputadores para o treinamento de IA, mais empresas chinesas estão usando chips de IA domésticos em seus data centers.

Gao Tongqing, vice-gerente geral da China Mobile, disse que a empresa comercializará três clusters de computação de IA este ano, abrigando quase 60.000 chips de IA domésticos, ou unidades de processamento gráfico, no total. Eles ajudarão a atender à demanda crescente da China por treinamento de IA de modelos de linguagem grandes em uma ampla gama de indústrias como transporte, saúde, educação e finanças, acrescentou Gao.

Zhang Ping’an, CEO da Huawei Cloud, braço de computação em nuvem da Huawei, que desenvolveu chips de IA internos, disse que, à medida que o governo dos EUA aperta as exportações de tecnologia de chips, é quase impossível para o continente chinês ter acesso aos processos de fabricação de semicondutores de 3 nanômetros ou 5 nanômetros, as duas tecnologias mais avançadas que já foram comercializadas no exterior.

“Devemos utilizar nossas vantagens em largura de banda e energia para compensar as deficiências em nossos chips e contornar as restrições,” disse Zhang.

Fonte Original: https://www.chinadaily.com.cn/a/202204/30/WS608bb624a310efa1bd65e5e1.html

Compartilhar: