OpenAssistant, um bot de IA de código aberto

OpenAssistant

O Open Assistant é um projeto que visa dar a todos acesso a um ótimo modelo de linguagem grande baseado em bate-papo.

Recentemente o comunidade LAION (Large-Scale Artificial Intelligence Open Network) revelada através de um anúncio a primeira versão do projeto «OpenAssistant», que desenvolve um chatbot de inteligência artificial capaz de entender e responder perguntas em linguagem natural, interagir com sistemas de terceiros e extrair dinamicamente as informações necessárias.

Para quem não conhece o LAION, saiba que ele desenvolve ferramentas, modelos e coleções de dados para criar sistemas gratuitos de aprendizado de máquina (por exemplo, a coleção LAION é usada para treinar modelos do sistema de síntese de imagens Stable Diffusion).

Adição código para treinar e organizar o trabalho do bot no seu computador, propõe-se usar uma coleção de modelos prontos utilizar um modelo de linguagem já treinado, treinado com base em 600 mil exemplos de diálogos na forma de solicitação-resposta (instrução-execução), elaborado e revisado com a participação de uma comunidade de entusiastas.

Foi também lançado um serviço online de avaliação da qualidade do chatbot, utilizando o modelo de conhecimento OA_SFT_Llama_30B_6, que abrange 30 mil milhões de parâmetros.

Nossa equipe trabalhou incansavelmente nos últimos meses coletando grandes quantidades de informações e feedback baseado em texto para criar um conjunto de dados incrivelmente diversificado e exclusivo projetado especificamente para modelos de linguagem de treinamento ou outros aplicativos de IA.

Com mais de 600 pontos de dados gerados por humanos cobrindo uma ampla gama de tópicos e estilos de escrita, nosso conjunto de dados provará ser uma ferramenta inestimável para qualquer desenvolvedor que queira criar modelos instrucionais de próxima geração.

Para aumentar a eficiência do sistema e evitar a necessidade de armazenar grandes quantidades de parâmetros predefinidos, o projeto prevê a possibilidade de utilizar uma base de conhecimento atualizada dinamicamente que possa recuperar a informação necessária através de motores de busca ou serviços externos.

Por exemplo, ao gerar respostas, o bot pode acessar APIs externas para obter dados adicionais. Das funcionalidades avançadas destaca-se também o suporte à personalização, ou seja, a capacidade de adaptação a um determinado utilizador com base nas suas frases anteriores.

Para os interessados ​​em instalar o OpenAssistant, você deve saber que pode instalá-lo localmente e que os modelos Pythia SFT candidatos estão disponíveis no HuggingFace e podem ser carregados por meio da biblioteca HuggingFace Transformers. Como tal, é possível que possam ser usados ​​com hardware suficiente. Existem também espaços em HF que podem ser usados ​​para conversar com o candidato OA sem seu próprio hardware. No entanto, esses modelos não são definitivos e podem produzir resultados ruins ou indesejados.

Os modelos LLaMa SFT não podem ser lançados diretamente devido à licença Meta, mas os pesos XOR serão lançados em breve.

É importante mencionar que o modelo menor atual (Pythia) tem parâmetros de 12B e é difícil de rodar em hardware de consumo, mas pode rodar em uma única GPU profissional. Pode haver modelos menores no futuro, e esperamos avançar em métodos como quantização inteira que podem ajudar a executar o modelo em hardware menor.

O projeto não pretende parar de repetir as capacidades do ChatGPT. Espera-se que o Open-Assistant estimule o desenvolvimento aberto no campo da geração de conteúdo e processamento de consultas em linguagens naturais, assim como o projeto open source Stable Diffusion estimulou o desenvolvimento de ferramentas de geração de imagens.

O código do projeto é escrito em Python e distribuído sob a licença Apache 2.0. Os desenvolvimentos do OpenAssistant podem ser usados ​​para criar seus próprios assistentes inteligentes e sistemas de diálogo que não estão vinculados a APIs e serviços externos. O hardware de consumo convencional é suficiente para funcionar, por exemplo, é possível trabalhar em um smartphone. Os dados do Open Assistant são liberados sob uma licença Creative Commons que permite uma ampla gama de usos, incluindo uso comercial.

Finalmente, se você estiver interessado em aprender mais sobre isso, bem como consultar o código-fonte, consulte os detalhes no link a seguir.