共绩算力博客

探索前沿技术，分享实践经验，追踪行业动态

AI 视频生成提速 200 倍：TurboDiffusion 如何让一小时的等待缩短至几十秒？

1.0 引言：当 AI 视频创作不再需要漫长等待近年来，AI 视频生成技术的发展令人瞩目，它能将简单的文字描述或单张图片转化为生动、高清的视频片段，为内容创作带来了前所未有的想象空间。然而，这项强大技术的背后，却隐藏着一个普遍的痛点：漫长的等待时间。生成一段高质量的 AI 视频，通常需要数十分钟...

2026年1月22日

2 分钟

世界模型正在掀起 AI 新浪潮

全新架构重构计算范式谷歌最新发布的 Gemini 3 Flash，从命名方式来看似乎是双子座 3 家族中一个“轻量”版本。但真正的不同之处不止是体积或速度，而是一种计算范式的转变。Gemini 3 Flash 针对实时响应、多模态协同、低能耗场景进行了特别优化，不再是传统意义上“大而全”的通用模...

2026年1月21日

1 分钟

共绩算力全镜像生态赋能，爆款 AI 漫剧完整生产流水线（全工具实操版）

2026 实战指南：一人一平台，如何用共绩算力打通 AI 漫剧全流程？ 2026 年的 AI 漫剧赛道，早已告别了“尝鲜”阶段，进入了残酷的“量产”比拼。作为创作者，你或许不缺脑洞大开的剧本，也不缺对画面审美的把控，但真正卡住你脖子的，往往是那条漫长而割裂的工具链：本地显卡跑不动、环境配置报错多、...

2026年1月19日

5 分钟

RTX 5090 是 AI 开发者的合适选择吗？

在评估下一代 GPU 时，开发者往往难以判断 RTX 5090 在实际 AI 工作负载、基础设施限制和成本方面，相比 RTX 4090 是否具有实质性的优势。本文通过考察三个核心维度来应对这一不确定性： 1. Blackwell 架构、FP8 加速和 32GB 显存在 LLM 推理、扩散和多模态生...

2026年1月15日

6 分钟

AI 智能体浪潮的背后：揭示生产环境中的 5 个意外真相

从能够自主完成复杂任务的超级助理，到颠覆整个行业的自动化大军，关于 AI 智能体（AI Agent）的讨论充满了天马行空的想象和巨大的期待。然而，在这些激动人心的愿景背后，现实世界中的智能体究竟是什么样子？它们是如何被构建、部署并创造实际价值的？最近，一份来自加州大学伯克利分校等顶尖机构的大规模...

2026年1月12日

1 分钟

统一多模态基础模型：发展、架构与挑战的全面综述

引言统一多模态基础模型（Unified Foundation Models, UFM）正站在人工智能研究的最前沿，代表着构建更通用、更强大人工智能系统的核心方向。物理学家理查德·费曼曾言：“我无法创造之物，亦无法理解之（What I cannot create, I do not underst...

2026年1月11日

5 分钟

点石成金：5 个让你大开眼界的 AI 提示技巧，彻底释放模型的真正潜力

你是否也曾有过这样的经历：满怀期待地向功能强大的人工智能（AI）模型提问，却只得到一些平庸、泛泛、甚至不着边际的回答？这确实令人沮丧。我们不禁会问，这些被誉为“革命性”的技术，潜力究竟在哪里？其实，决定 AI 输出质量的关键，往往不在于 AI 本身，而在于我们的提问方式——这门艺术与科学被称为“...

2026年1月4日

9 分钟

点石成金：5 个让你大开眼界的 AI 提示技巧，彻底释放模型的真正潜力

2025年12月31日

9 分钟

Z-Image 技术白皮书：高效单流扩散 Transformer 赋能新一代图像生成

摘要与引言近年来，文本到图像（Text-to-Image, T2I）生成技术取得了革命性进展，然而，其发展也面临两大严峻挑战。一方面，性能最顶尖的模型，如 Nano Banana Pro 与 Seedream 4.0，多为不透明的闭源系统，其技术细节和复现路径难以企及。另一方面，领先的开源模型为...

2025年12月26日

4 分钟

AI 视频生成提速 200 倍：TurboDiffusion 如何让一小时的等待缩短至几十秒？

2025年12月26日

2 分钟

Dolphin-v2：拍照论文也能实现精准解析

Dolphin-v2 是 ByteDance 最新发布的文档解析模型，有一个功能打破了我的惯性认知：它对拍照生成的文档，比数字文档更重视整体页面的结构。这并不是偶然。多数模型处理拍照文档时容易受扭曲、光影干扰的影响，只能提取片段式信息。Dolphin-v2 采用了“拍照文档整体解析、数字文档并行元...

2025年12月24日

1 分钟

Qwen3-VL：引领多模态交互新范式

多模态不只是图文拼贴市面上号称“理解图像 + 对话”的模型不少，但能真正在产品中接管操作、进行图形编程、面向任务完成交互的，多数仍停留在演示层面。Qwen3-VL-235B-A22B-Thinking，来自通义千问团队，是一款不太“礼貌”的选手：它不只是看图说话，而是真正能“看图干活”。从功能...

2025年12月16日

1 分钟

GLM-4.6V：重塑多模态智能新范式

GLM-4.6V 是智谱 AI 最新发布的多模态大模型，兼具高性能与实用性，彻底刷新了对视觉语言模型的期待。模型架构与亮点 GLM-4.6V 系列包括两个版本：GLM-4.6V（106B）面向云端与大集群，GLM-4.6V-Flash（9B）则为本地场景精细裁剪，适配桌面助手与边缘部署。二者都具备...

2025年12月15日

1 分钟

给 TRAE SOLO 一台服务器，它能干什么？

前一阵子刷到一个很有意思的操作：有人直接把一台服务器的权限扔给了 AI，并简单说了句目标。然后，AI 就从零开始安装环境、配依赖，拉仓库，启动服务，最后成功完成了对外服务的提供。今天，我们就尝试下这个思路：让 TRAE SOLO 自行在远程服务器中搭建一套 MinerU 环境。 MinerU 首...

2025年12月12日

3 分钟

对话共绩算力联合创始人王鹏：用闲时算力共享撬动 AI 未来 | 极新直播实录

科技新鲜事，尽在掌握当 AI 推理需求从实验室走向产业应用，算力供给方式正在经历一场静默革命：个人电脑秒变计算节点、网吧夜间闲置资源被激活、云平台闲时算力被精准调度……在这场变革中，一家成立仅两年的创业公司如何用平台模式重构算力市场？11 月 4 日，共绩算力联合创始人王鹏做客极新企服直播间，分享...

2025年12月10日

2 分钟

AI 智能体浪潮的背后：揭示生产环境中的 5 个意外真相

深入现场：AI_智能体，究竟什么才有效？.mp4(/assets/Hdg6bsNOXoZBqCx3n1pcIPk9nzg.mp4) 从能够自主完成复杂任务的超级助理，到颠覆整个行业的自动化大军，关于 AI 智能体（AI Agent）的讨论充满了天马行空的想象和巨大的期待。然而，在这些激动人心的愿景背...

2025年12月9日

1 分钟

深度代理如何利用文件系统进行上下文工程

深度代理的一个关键特性是它们能够访问一组文件系统工具。深度代理可以使用这些工具来读取、写入、编辑、列出并搜索文件系统中的文件。在这篇文章中，我们将讲解为什么我们认为文件系统对代理来说很重要。为了理解文件系统为何有帮助，我们应先思考代理今天可能存在的不足之处。它们要么失败，要么是因为（a）模型不够好...

2025年12月8日

1 分钟

小模型，大革命：腾讯开源 HunyuanOCR 如何以 10 亿参数颠覆行业

光学字符识别（OCR）技术早已渗透到我们工作和生活的方方面面，但传统的 OCR 方案往往像一个庞大而笨拙的工厂流水线，不仅部署复杂、维护成本高昂，而且环环相扣的流程极易导致错误累积，最终影响识别的准确性。现在，这一长期存在的挑战迎来了新的破局者。腾讯最近开源了一款名为 HunyuanOCR 的模型，...

2025年12月5日

1 分钟

共绩科技 2023 年成立于清华，专注于构建融合算力与电力的智能调度网络，旨在提供平价、可靠、绿色的算力服务，使 AI 技术真正普及至每个人。通过精细调度算法，已为多家 AIGC 领军企业及科研机构提供高效算力，目标提升资源利用率 60%。作为一群清华背景的年轻创新者，我们在 2023 年秋季获得奇绩创坛等投资，正引领算力革命，开启普惠科技新篇章。

公司地址

北京市海淀区中关村国际创新大厦 3 层

邮箱

ai@suanleme.cn

支持

服务协议隐私协议联系我们反馈

公司

使命

咨

询

销售

反馈

联系我们