学习 - 智狐AI导航

VideoTuna

VideoTuna是一款基于AI的开源视频生成工具，支持文本到视频、图像到视频以及文本到图像的转换。它提供预训练、微调和后训练对齐等功能，兼容U-Net和DiT架构，并计划引入3D视频生成能力。VideoTuna旨在简化视频内容创作流程，提升生成质量与可控性，适用于内容创作、电影制作、广告营销、教育培训等多个领域。

AI项目与工具 2025年06月12日 30 点赞 0 评论 632 浏览

瑞智病理大模型

瑞智病理大模型（RuiPath）是由上海交通大学医学院附属瑞金医院与华为联合开发的国产多模态病理诊断系统，覆盖中国90%的常见癌种及部分罕见病。通过整合图像、文本等多源数据，实现高效、精准的辅助诊断，支持交互式审核流程，提升诊断效率与准确性。模型基于深度学习与华为DCS AI平台，适用于临床诊断、基层医疗、医学教育等多个场景，推动病理诊断智能化发展。

AI项目与工具 2025年06月12日 95 点赞 0 评论 632 浏览

WebLI

WebLI-100B是由Google DeepMind推出的超大规模视觉语言数据集，包含1000亿个图像与文本配对数据，是目前最大的视觉语言数据集之一。其设计旨在提升模型对长尾概念、文化多样性和多语言内容的理解能力。数据集通过网络爬取构建，保留了丰富的语言和文化多样性，支持多模态任务如图像分类、图像描述生成和视觉问答，广泛应用于人工智能研究、工程开发及教育领域。

AI项目与工具 2025年06月12日 51 点赞 0 评论 631 浏览

VideoGrain

VideoGrain是由悉尼科技大学与浙江大学联合研发的零样本多粒度视频编辑框架，支持类别级、实例级和部件级的精细化视频修改。它通过调节时空交叉注意力和自注意力机制，提升文本提示对目标区域的控制能力，确保时间一致性与特征分离，显著优于现有T2I和T2V方法。该工具无需额外参数调整，具备高效计算性能，适用于影视制作、广告营销、内容创作等多个领域。

AI项目与工具 2025年06月12日 99 点赞 0 评论 631 浏览

FoloToy

一款AI陪伴对话玩具，我们采用了最新的人工智能技术和爱来制作。每个人都可以使用 FoloToy 亲手打造一个与众不同的玩具角色，给爱的人带来快乐。

生活创意 2025年06月05日 40 点赞 0 评论 630 浏览

ReCamMaster

ReCamMaster 是由浙江大学与快手科技联合开发的视频重渲染框架，支持根据用户指定的相机轨迹生成新视角视频。采用预训练模型与帧维度条件机制，实现视频视角、运动轨迹的灵活调整。具备视频稳定化、超分辨率、外扩等功能，适用于视频创作、后期制作、自动驾驶和虚拟现实等领域，提升视频内容的表现力与质量。

AI项目与工具 2025年06月12日 95 点赞 0 评论 630 浏览

Jina

Jina-embeddings-v3 是一款基于 Transformer 架构的文本嵌入模型，支持多语言处理和长文本分析。通过 LoRA 适配器和 Matryoshka 表示学习技术，模型能够生成高质量的嵌入向量，适用于多种任务，包括查询-文档检索、聚类、分类和文本匹配。其高性能和成本效益使其适用于生产环境及边缘计算场景。

AI项目与工具 2025年06月12日 24 点赞 0 评论 629 浏览

Offline Chat

Offline Chat是一款专为iOS设备设计的离线AI聊天应用程序。它支持完全在本地运行，无需网络连接，确保用户数据的安全和隐私。用户可以加载和查询私人文档，并且可以选择不同性能的AI模型。这款应用适用于商务、学习和旅行等多种场景，是注重隐私保护和便携性的理想助手。

AI项目与工具 2025年06月12日 16 点赞 0 评论 629 浏览

MatterGen

MatterGen是由微软开发的生成式AI模型，专注于无机材料的设计与生成。它通过扩散过程逐步优化原子结构，生成稳定、多样化且符合特定性能要求的材料。支持化学组成、磁性、电子和机械性能等多维度约束，适用于逆向材料设计，提升新材料研发效率。已应用于能源、催化、电子等领域，推动材料科学进步。

AI项目与工具 2025年06月12日 16 点赞 0 评论 629 浏览

HandTalk

一款利用人工智能技术，自动将文本和音频翻译成手语的应用程序。它支持美国手语（ASL）和巴西手语（Libras），为全球约4.66亿聋人和重听人士提供了一个融入社会的新途径。

AI写作对话 2025年06月05日 24 点赞 0 评论 628 浏览

学习

首页

学习

列表

默认

浏览次数

发布日期