AI项目与工具

Baichuan

Baichuan-NPC(百川角色大模型)是一款由百川智能公司推出的智能角色模型,通过文本描述即可生成具有生动表现力的角色智能体。该模型在“角色知识”与“对话能力”方面进行了深度优化,确保角色能更准确地理解对话语境,并根据角色性格进行交流和互动。主要功能包括高效对话能力、高度定制角色创建、严格的事实性回复、高质量数据预训练及思维链对齐技术。

SelectYet

SelectYet是一款基于AI技术和“记忆摘要”技术的文献分析工具,能够对海量文献进行结构化分析,快速提取关键信息并生成文献综述。用户可输入研究主题、上传PDF文献,并设置自定义分析选项,工具支持结果导出为Excel格式。它适用于高效学习、数据编码、行业研究、批改代工、市场调研和政策分析等场景,接入了deepseek-R1/V3模型,未来将融合更多模型提升分析效率与准确性。

HumanDiT

HumanDiT是一种由浙江大学与字节跳动联合开发的高保真人体视频生成框架,基于扩散变换器(DiT)实现姿态引导的视频生成。它支持长序列、多分辨率视频生成,并通过关键点扩散变换器(Keypoint-DiT)确保动作的连贯性与自然性。引入前缀潜在参考策略以保持个性化特征,结合姿态适配器和细化模块提升细节质量。适用于虚拟人、动画制作、沉浸式体验及视频续写等多种场景。

Pixel Reasoner

Pixel Reasoner是由多所高校联合开发的视觉语言模型,通过像素空间推理增强对视觉信息的理解和分析能力。它支持直接对图像和视频进行操作,如放大区域或选择帧,以捕捉细节。采用两阶段训练方法,结合指令调优和好奇心驱动的强化学习,提升视觉推理性能。在多个基准测试中表现优异,适用于视觉问答、视频理解等任务,广泛应用于科研、教育、工业质检和内容创作等领域。

晓象

晓象是一款基于自研可信大模型的AI克隆工具,可创建各领域知识博主的虚拟分身。该工具能够模仿博主的声音、风格和表达方式,生成个性化的高质量内容,并支持实时互动,帮助用户获取知识分享和信息解读。应用场景广泛,包括知识传播、教育辅助、内容创作及信息解读。

NLWeb

NLWeb是微软推出的开源项目,旨在通过自然语言界面简化网站交互,使网站成为AI驱动的应用程序。它利用半结构化数据(如Schema.org、RSS)和LLM工具,提供自然语言交互、内容发现、智能体交互等功能。支持MCP协议,实现与AI助手的无缝对接,具备跨平台和高度可扩展性,适用于零售、餐饮、旅游、新闻及客服等多种场景。

Crawl4LLM

Crawl4LLM是由清华与CMU联合开发的智能爬虫系统,通过评估网页对大语言模型预训练的价值,提升数据获取效率。支持多种爬取模式,具备状态保存、数据可视化功能,并与DCLM框架兼容。采用多维度评分机制优化爬取策略,减少低价值内容抓取,降低对网站负担,适用于LLM预训练、数据集构建等场景。

k0

k0-math是一款基于强化学习和思维链推理技术的新一代数学推理模型,由月之暗面推出。它在多个数学基准测试中表现出色,特别是在中考、高考、考研及竞赛级数学题库中的成绩超越了OpenAI的o1-mini和o1-preview模型。k0-math具备深入思考、规划解题思路以及自我反思优化的能力,适用于教育辅导、在线教育平台、竞赛培训、学术研究及自动化测试与评分等多个场景。

Research Rabbit

Research Rabbit是一款基于人工智能技术的科研文献管理工具,主要功能包括文献检索、集合创建、网络关系分析、时间轴展示、智能摘要和阅读、云端存储和管理以及协作和共享。该工具支持多种搜索选项,能够帮助用户发现和理解文献之间的联系,适用于个人和团队研究,涵盖多个学科领域。

StarVector

StarVector 是一个开源多模态视觉语言模型,支持图像和文本到可编辑 SVG 文件的转换。采用多模态架构,结合图像编码与语言模型,生成结构紧凑、语义丰富的 SVG 内容。基于 SVG-Stack 数据集训练,适用于图标设计、艺术创作、数据可视化等多种场景,具备良好的性能和扩展性。