Terminal de consulta web

Adaptive asynchronous pipeline parallelism for large language models

Adaptive asynchronous pipeline parallelism for large language models

Guilherme Mendeleh Perrotta

DISSERTAÇÃO

Inglês

T/UNICAMP P429a

[Paralelismo de pipeline assíncrono adaptativo para grandes modelos de linguagem]

Campinas, SP : [s.n.], 2024.

1 recurso online (67 p.) : il., digital, arquivo PDF.

Orientadores: Guido Costa Souza de Araújo, Sandro Rigo

Dissertação (mestrado) - Universidade Estadual de Campinas (UNICAMP), Instituto de Computação

Resumo: O advento da arquitetura Transformer em 2017 iniciou uma corrida na qual desenvolvem- se Large Language Models (LLMs) com cada vez mais parâmetros para obter resultados no estado da arte em uma ampla gama de aplicações. À medida que o tamanho dos modelos aumentou exponencialmente nos últimos... Ver mais
Abstract: The advent of the Transformer architecture in 2017 started a race of developing Large Language Models (LLMs) with an ever-growing number of parameters to obtain state-of- the-art results for a wide range of applications. As the model size increased exponentially over the last few years, so... Ver mais

Requisitos do sistema: Software para leitura de arquivo em PDF

Aberto

Adaptive asynchronous pipeline parallelism for large language models

Guilherme Mendeleh Perrotta

										

Adaptive asynchronous pipeline parallelism for large language models

Guilherme Mendeleh Perrotta