AI项目与工具

Dia

Dia是一款结合人工智能技术的新型网络浏览器,具备智能写作辅助、地址栏命令执行和自动化任务处理等功能。它能够帮助用户高效地从互联网获取信息、管理日程、优化购物体验以及提升团队协作效率,同时支持个性化内容创作和项目管理。

CNKI AI学术研究助手

CNKI AI学术研究助手是一款由华知大模型驱动的AI辅助研究工具,专注于科研全流程的支持。其主要功能涵盖问答式增强检索、AI辅助研读、AI辅助创作及苹果树智能体服务,能够提供学术问答、文献综述生成、语言翻译、深度解读等多种能力,适用于文献检索、学术写作及研究趋势分析等多个场景,助力科学研究与创新。

谷歌DeepMind推出V2A技术,可为无声视频添加逼真音效

DeepMind推出的V2A(Video-to-Audio)模型能够将视频内容与文本提示相结合,生成包含对话、音效和音乐的详细音频轨道。它不仅能够与DeepMind自身的视频生成模型Veo协同工作,还能与其他视频生成模型,如Sora、可灵或Gen 3等,进行集成,从而为视频添加戏剧性的音乐、逼真的音效或与视频中角色和情绪相匹配的对话。V2A的强大之处在于其能够为每个视频输入生成无限数量的音轨。该模

翰林妙笔

翰林妙笔是一款利用先进AI技术打造的公文写作辅助工具,具备文本生成、润色、校对、风格调整等多种功能,支持用户快速生成高质量公文。该工具拥有丰富的模板和素材库,适合大学生、公务员、教师及社区工作者等群体使用,显著提高写作效率和文本质量。

roomGPT

RoomGPT是一款基于AI技术的室内设计工具,用户上传房间照片后,可在几秒内生成多种设计方案,涵盖不同主题、色彩搭配及家具布局。它还提供成本估算功能,帮助用户在保持预算可控的前提下实现理想的设计效果,广泛适用于个人住宅、商业空间、房地产营销及教育领域。

MyTimeMachine

MyTimeMachine是一款基于深度学习的面部年龄转换工具,支持高质量的年龄回退与进展效果,同时保持个体身份特征。它通过适配器网络结合个性化与全局老化特征,能够生成高分辨率、逼真的静态图像及时间一致的视频老化效果。此外,MyTimeMachine在身份保持、外推能力及视频扩展方面具有显著优势,并广泛应用于影视制作、广告、法医学、历史重现及个人娱乐等领域。

QueryPal

QueryPal是一款嵌入Slack和Microsoft Teams的AI聊天助手,可从多个企业数据源(如Google Drive、Notion、Jira等)中提取信息,即时回答员工问题,从而提升工作效率。它支持多种应用场景,包括新员工培训、DevOps支持及客户服务,并能自动管理知识库,减少对静态文档的依赖。

smolagents

SmolAgents 是 Hugging Face 开发的轻量级智能代理框架,支持多种大语言模型集成与安全代码执行。具备模块化设计、直观 API 及丰富文档,适用于数据检索、自动化编程、智能客服等多种场景,降低 AI 开发门槛,提升开发效率。

DistriFusion

DistriFusion是一个专为加速高分辨率扩散模型在多GPU环境中生成图像的分布式并行推理框架。通过将图像分割成多个小块并分配至不同设备上进行独立处理,它能够在不增加额外训练负担的情况下,将推理速度提升高达六倍,同时保持图像质量。其技术原理包括Patch Parallelism(分片并行)、异步通信、位移补丁并行性等,适用于多种现有的扩散模型。应用场景包括AI艺术创作、游戏和电影制作、VR/A

Aero

Aero-1-Audio 是一款基于 Qwen-2.5-1.5B 的轻量级音频模型,拥有 1.5 亿参数,专注于长音频处理,支持连续 15 分钟音频输入并保持上下文连贯性。在语音识别、复杂音频分析及指令驱动任务中表现出色,具备高效的训练方法和多任务处理能力,适用于语音助手、实时转写、归档理解等场景。