AI项目与工具

LipRead Pro

LipRead Pro 是一款基于AI技术的视频唇读工具,可将视频中的唇部动作转换为文字,支持多语言和口音识别。其高精度算法确保了文字输出的准确性,适用于内容创作、无障碍辅助、安全监控、历史档案修复等多种场景。操作简便,处理高效,注重用户数据隐私保护,适合专业用户和普通用户使用。

Llama Tutor

Llama Tutor 是一款基于 AI 的开源个性化学习平台,利用 Llama 3.1 和 Together AI 技术生成定制化学习计划,涵盖多学科领域,提供互动式学习体验和精准解答。支持个人学习、学术教育、职业发展和语言学习等应用场景,致力于打造高效、有趣的沉浸式学习环境。

AgentCPM

AgentCPM-GUI是由清华大学与面壁智能团队联合开发的开源端侧GUI代理系统,专为中文应用场景优化。基于MiniCPM-V模型,支持通过截图输入并自主执行用户指令,具备高精度GUI元素识别与OCR能力。采用强化微调和紧凑动作空间设计,提升任务执行效率与移动端适配性。适用于智能助手、自动化测试、老年人辅助及企业应用等领域。

从容大模型

从容大模型是云从科技推出的多模态AI模型,在国际评测中表现优异,具备视觉语言理解与推理能力。其核心技术包括多模态对齐、高效工程优化和原生多模态推理,支持复杂场景下的文本识别和开放域问答。该模型在医学健康、金融、制造、政务等多个领域实现规模化应用,助力智能化转型。

CodeCV

CodeCV是一款面向互联网从业者的在线简历制作工具,支持Markdown和所见即所得编辑模式。它提供多种免费模板,并具备AI辅助功能,如简历润色和中英互译。用户可自由选择模板并专注内容创作,系统自动完成排版和分页,支持多格式导出,广泛应用于个人求职、职业发展、学生实习、自由职业和跨区域求职等场景。

Zona

Zona是一款基于AI技术的音乐生成工具,用户可通过输入创意或选择模板即时生成专业级别的音乐作品。该工具支持移动便携,具备个性化定制、创意激发及多功能编辑能力,广泛适用于个人娱乐、音乐教育、创意激发及社交媒体内容制作等多个领域。

神采PromeAI

神采PromeAI是一款面向建筑师、室内设计师、产品设计师及游戏动漫设计师的AI设计助手。它通过强大的AIGC模型风格库,支持用户通过文字描述、草图或图片上传,快速生成高质量的设计图。此外,PromeAI还具备旧建筑翻新功能,能够提供高效的旧区改造设计方案,并支持多种风格转换和细节调整,从而实现卓越的视觉效果。

Lobe Vidol

Lobe Vidol是一个开源的数字人创作平台,支持用户轻松创建和定制虚拟偶像。它具备流畅的对话交互、背景设定、动作库、角色编辑功能,还支持MMD舞蹈和PMX舞台加载。通过TTS与STT技术,Lobe Vidol实现了语音与文本的双向转换,提供沉浸式用户体验。 ---

DAM

DAM-3B是英伟达开发的多模态大语言模型,专用于图像和视频中特定区域的详细描述。支持点、边界框、涂鸦或掩码等方式指定目标区域,生成精准文本描述。其核心技术包括焦点提示与局部视觉骨干网络,有效融合全局与局部特征。DAM-3B-Video版本扩展至视频处理,适用于动态场景。模型基于Transformer架构,支持多模态输入,广泛应用于内容创作、智能交互及无障碍工具等领域。

Krut AI

Krut AI是一款专注于电商领域的AI图像生成工具,提供产品图像生成、模特照片创作、背景移除、图像放大、虚拟试穿等多项功能。用户可通过文本或图片输入快速生成高质量视觉内容,无需复杂操作。平台适用于电商产品展示、广告设计、社交媒体内容制作等多个场景,支持多语言内容生成,助力企业提升视觉表现力和运营效率。