AI项目与工具

RDT

RDT是清华大学AI研究院推出的一款双臂机器人操作任务扩散基础模型,拥有十亿参数量,可自主完成复杂任务,如调酒和遛狗。该模型基于模仿学习,具备强大的泛化能力和操作精度,支持多种模态输入和少样本学习。RDT已在餐饮、家庭、医疗、工业及救援等领域展现广泛应用前景,推动机器人技术发展。

OneAI

OneAI是一款基于AI大语言模型的智能对话工具,支持多语言交流、信息检索、文本创作、翻译及生活辅助等功能。适用于学习辅导、写作协助、客户服务等多种场景,提供高效、精准的服务,提升用户体验与效率。

Webscrape AI

Webscrape AI是一款基于AI技术的网页数据采集工具,无需编程技能即可实现自动化数据抓取。它具有高精度、高效率和可定制化的特点,能够帮助企业快速获取所需数据,广泛应用于市场研究、价格监控、客户反馈分析等领域。此外,Webscrape AI提供灵活的订阅方案,适应不同规模企业的使用需求。

星伴kChat

星伴kChat是一款由KMind开发的AI聊天机器人,基于kOS操作系统运行。它具备工作模式和闲聊模式,分别用于高效完成工作任务和提供轻松的社交互动。星伴kChat能够自动化执行任务,并提供个性化服务,适用于专业人士、学生、企业用户以及技术爱好者等不同群体。

SPRIGHT

SPRIGHT是由多所高校和机构联合开发的视觉-语言数据集,旨在提升文本到图像生成模型的空间一致性。通过重新描述约600万张图像,强化空间关系表达,如“左/右”、“上/下”等,显著提高图像生成的准确性。该数据集支持复杂场景的图像生成,并经过多维度评估验证其可靠性。SPRIGHT为视觉-语言模型的研究和应用提供了重要资源,广泛应用于图像生成、VR/AR、教育及科研等领域。

OmniVision

OmniVision是一款面向边缘设备的紧凑型多模态AI模型,参数量为968M。它基于LLaVA架构优化,能够处理视觉与文本输入,显著降低计算延迟和成本。OmniVision支持视觉问答、图像描述等功能,广泛应用于内容审核、智能助手、视觉搜索等领域。

Imagine Explainers

Imagine Explainers 是一款基于 AI 的视频生成工具,支持用户根据主题和时长快速生成高质量动画视频。提供多种模板、角色和风格选择,支持 AI 语音或自定义音频。适用于教育、商业、营销等多个领域,能够将复杂内容转化为直观的视觉表达,提升信息传达效率。

Dippy

Dippy 是一款基于 AI 技术的个性化伴侣平台,通过虚拟角色实现与用户的互动交流。其特色包括思维链技术,使用户能洞察 AI 回答的逻辑过程;同时支持用户自定义角色外观、情感陪伴、语言学习及任务管理等功能。Dippy 目前专注于 iOS 用户群体,致力于打造高度个性化且透明的 AI 交互体验。

sCM

sCM是一种由OpenAI开发的基于扩散模型的连续时间一致性模型,通过简化理论框架与优化采样流程,实现了图像生成速度的大幅提升。该模型仅需两步采样即可生成高质量图像,且速度比传统扩散模型快50倍。得益于连续时间框架和多项技术改进,sCM不仅提高了训练稳定性,还提升了生成质量。其应用场景广泛,包括视频生成、3D建模、音频处理及跨媒介内容创作,适用于艺术设计、游戏开发、影视制作等多个行业。

Llama 4

Llama 4 是 Meta 推出的多模态 AI 模型系列,采用混合专家(MoE)架构,提升计算效率。包含 Scout 和 Maverick 两个版本,分别适用于不同场景。Scout 支持 1000 万 token 上下文,Maverick 在图像理解和创意写作方面表现优异。Llama 4 支持 200 种语言,具备强大的语言生成与多模态处理能力,适用于对话系统、文本生成、代码辅助、图像分析等多个