模型

Pangea

Pangea是一款由卡内基梅隆大学团队开发的多语言多模态大型语言模型,支持39种语言,具备多模态理解和跨文化覆盖能力。其主要功能包括多语言文本生成与理解、图像描述、视觉问答等,同时通过高质量指令和文化相关任务优化性能。Pangea基于丰富的数据集和先进的模型架构,适用于多语言客户服务、教育、跨文化交流等多个领域。

MiniMax开放平台

MiniMax开放平台是国内领先的拥有文本、语音、视觉三模态融合的千亿参数语言大模型。这个平台由创业公司MiniMax构建,致力于通过搭建超大规模实验平台与推理平台,实现技术与产品...

DL4J

DL4J开源的使用JVM部署和训练...

UniTok

UniTok是由字节跳动联合高校研发的统一视觉分词器,支持视觉生成与理解任务。其采用多码本量化技术,将视觉特征分割并独立量化,显著提升离散token的表示能力。在ImageNet上实现78.6%的零样本分类准确率,图像重建质量达0.38。可作为多模态大语言模型的视觉输入模块,广泛应用于图像生成、视觉问答、内容创作及跨模态检索等场景。

大模型GPT学习手册

从网上搜集整理了3个ChatGPT学习手册平台,里面系统的介绍了有关ChatGpt的应用和相关,如何注册和使用,助你快速加入ai大军之中。

Cerebellum

Cerebellum是一款结合Claude 3.5 Sonnet与Selenium WebDriver的智能化浏览器助手,通过构建网页浏览的有向图模型,利用LLM技术分析页面内容和交互元素,智能规划操作路径并动态调整策略。它支持多浏览器操作,可精确模拟用户行为,广泛应用于网页自动化测试、数据抓取、内容管理及电子商务等多个领域。

魔多AI

一个专为AI创作者打造的趣玩社区,提供多种AI模型和创作工具,支持用户进行插画、动漫、写实等多种风格的图像创作。

豆包·语音播客模型

豆包·语音播客模型是字节跳动旗下火山引擎推出的语音播客工具,基于流式模型构建,可将文本秒级转化为双人对话式播客。具有低成本、高时效、强互动特点,解决了传统AI播客内容重复、不够口语化的问题。支持低时延与可打断、深度搜索、高效创作、超长文本转播客等功能,适用于教育、娱乐、心理咨询、内容营销和有声读物制作等场景。

通义点金

通义点金,大模型驱动的智能金融助手,深度解读财报研报,轻松分析金融事件,自动绘制图表表格,实时市场数据分析,助力用户对话金融世界。

GameNGen

GameNGen是谷歌推出的一款AI游戏引擎,它能够以每秒20帧的速度实时生成高质量的DOOM游戏画面,使大多数玩家难以分辨真假。该工具无需编程,简化了开发流程,同时具备高逼真度和交互式体验,为游戏创作提供了新的可能性。除了游戏开发,它还能应用于虚拟现实、自动驾驶等多个领域,具有广泛的应用前景。