首页
新闻资讯
使用教程
联系客服
发布文章
留言板
原创激励
访问云平台
关于
登录/注册
星宇云社区
行动起来,活在当下
累计撰写
37
篇文章
累计创建
15
个标签
累计收到
19
条评论
栏目
首页
新闻资讯
使用教程
联系客服
发布文章
留言板
原创激励
访问云平台
关于
登录/注册
目 录
CONTENT
以下是
DeepSeek
相关的文章
2025-09-03
Compute Capability(CC 值)详解及模型量化所需 CC 值指南
一、Compute Capability(CC 值)基础定义 Compute Capability(简称 CC 值)是 NVIDIA 为其 GPU 架构定义的硬件能力标识,采用 “主版本号。次版本号”(如 6.1、7.5、8.6)的格式,直接关联 GPU 的硬件架构(如 Pascal、Volta、A
2025-09-03
112
1
7
人工智能
2025-08-12
手机跑大模型成真!腾讯混元开源 4 款 "迷你强"
8月4日,腾讯混元正式开源 0.5B、1.8B、4B、7B 四款小参数模型,目前已同步上线 GitHub 与 HuggingFace 平台。 这四款“小”模型定位
2025-08-12
67
0
4
显卡
云原生
人工智能
2025-08-05
国家队出手!一文看懂“焕新社区”到底能干啥
7月26日,2025世界人工智能大会“AI焕新 产业共赢”企业人工智能产业发展论坛上,由国家相关部委指导、国务院国资委统筹推进,中国移动
2025-08-05
37
0
4
云计算
人工智能
云原生
显卡
2025-08-01
关于Moe与Dense模型的理解
在2024年12月26日,DeepSeek开源了DeepSeek-V3模型,相较于其之前发布的DeekSeek-V2,创新的采用了多头注意力(MLA)和DeepSeekMoE架构。而在2025年火爆的DeepSeek-R1思考模型也是继续沿用的这个机制,Moe架构在国内一下就爆火了起来,为此,本文将
2025-08-01
192
0
4
人工智能
2025-07-29
通义千问Qwen3深夜突袭,碾压同行霸榜12项评测
近日,阿里云通义千问团队闪电推出旗舰大模型Qwen3的重大升级版本Qwen3-235B-A22B-Instruct-2507-FP8。 此次升级不仅以数学推理(AIME25测试70.3分)、编程实战<
2025-07-29
62
0
4
人工智能
新闻资讯
显卡