AI项目与工具

TalkMe

TalkMe 是一款基于 AI 的语言学习工具,支持多语种对话练习,涵盖日常、商务、旅游等真实场景。AI 伙伴提供实时反馈、语法纠正和发音指导,帮助用户提升口语能力。平台支持个性化学习路径,适合各类语言学习者,提高学习效率与实际应用能力。

EmoLLM

EmoLLM 是一款基于多模态技术的心理健康支持工具,能通过文本、图像和视频分析用户情绪,提供情绪识别、心理辅导和情感支持。其核心包括多视角视觉投影、情感引导提示和指令微调技术,支持个性化辅导、角色扮演及多轮对话,适用于心理健康评估与干预场景。

LMEval

LMEval是谷歌推出的开源框架,用于简化大型语言模型(LLMs)的跨提供商评估。它支持多模态(文本、图像、代码)和多指标评估,兼容Google、OpenAI、Anthropic等主流模型提供商。LMEval基于增量评估引擎,节省时间和计算资源,并通过自加密的SQLite数据库安全存储评估结果。LMEvalboard提供交互式可视化界面,帮助用户分析模型性能并直观比较不同模型的优缺点。

Sonar

Sonar是Perplexity推出的AI搜索API,支持实时联网搜索、结构化输出及定制化数据源,适用于多种企业级应用场景。其核心优势在于高准确性和上下文处理能力,提供基础版和高级版服务,满足不同复杂度的搜索需求,广泛应用于IT、财务、客户服务等领域。

WonderWorld

WonderWorld是一款基于斯坦福大学和麻省理工学院合作研发的3D场景生成框架,通过Fast LAyered Gaussian Surfels(FLAGS)表示法与引导深度扩散技术,从单张图片快速生成连贯且多样化的虚拟场景。用户可实时交互,生成包括城市、自然、幻想等多种风格的3D环境,并适用于游戏开发、虚拟现实、增强现实以及建筑设计等多个领域。

UniTok

UniTok是由字节跳动联合高校研发的统一视觉分词器,支持视觉生成与理解任务。其采用多码本量化技术,将视觉特征分割并独立量化,显著提升离散token的表示能力。在ImageNet上实现78.6%的零样本分类准确率,图像重建质量达0.38。可作为多模态大语言模型的视觉输入模块,广泛应用于图像生成、视觉问答、内容创作及跨模态检索等场景。

Midscene.js

Midscene.js 是一款基于 AI 的自动化 SDK,利用自然语言处理技术简化 UI 测试流程。它支持用户通过自然语言描述操作步骤,自动执行动作、查询数据、断言页面状态,并生成可视化报告。Midscene.js 可无缝集成到现有项目中,适用于自动化测试、数据抓取、性能监控等多种场景。

幻图AI

幻图AI是一款基于AI技术的免费图像处理工具,支持文生图、图片和视频换脸、换装、头像定制等功能。用户通过简单的操作即可生成高质量的创意图像和视频,广泛应用于社交媒体、电商、广告设计和教育培训等领域,提供高效且个性化的视觉创作体验。

SepLLM

SepLLM是由香港大学与华为诺亚方舟实验室等机构联合开发的高效大语言模型框架,通过压缩段落信息和优化注意力机制,显著提升推理速度与计算效率。其支持处理超长序列(达400万标记),具备低KV缓存占用、高推理速度及多节点分布式训练能力。适用于长文本处理、流式应用、资源受限环境及多语言研究等多个场景,具有良好的部署灵活性和扩展性。

福棠·百川

福棠·百川是全球首个儿科大模型,由国家儿童医学中心等机构联合研发,具备强大的临床推理能力和循证医学模式,整合了海量医疗数据和专家经验,可提供个性化诊疗方案。该模型应用于基层和专家版,分别服务于日常诊疗和疑难病诊断,已在北京儿童医院投入使用,诊断准确率达95%。同时支持在线问诊、远程会诊、教育及科研等多场景应用。