Pixtral Large
Pixtral Large是一款由Mistral AI开源的超大规模多模态模型,具备1240亿参数,支持文本、图像和图表的理解与生成。它拥有128K的上下文窗口,能在多语言环境中处理复杂文档和多图像场景,广泛应用于教育、医疗、客服和内容审核等领域。
Text Behind Image
Text Behind Image 是一款开源在线工具,支持用户在图片中主体背后添加自定义文字,提供多样化的样式定制选项,包括字体、颜色、位置等。它基于 Next.js 框架,采用前端图像处理技术,适配多种应用场景,如社交媒体营销、广告宣传、个人表达及教育用途。
DriveDreamer4D
DriveDreamer4D是一个专注于提升自动驾驶场景4D重建质量的框架,通过整合世界模型先验知识生成新的轨迹视频,同时确保时空一致性,从而增强训练数据集的多样性和真实性。它具备4D场景重建、新轨迹视频合成、时空一致性控制以及提升渲染质量等功能,广泛应用于自动驾驶系统开发、闭环仿真测试及传感器数据模拟等领域。
---
