最新文章

深入理解DeepSeek与企业实践(二):32B多卡推理的原理、硬件散热与性能实测

前言在《深入理解 DeepSeek 与企业实践(一):蒸馏、部署与评测》文章中,我们详细介绍了深度模型的蒸馏、量化技术,以及 7B 模型的部署基础,通常单张 GPU 显存即可满足7B模型完整参数的运行需求。然而,当模型的参数量增长至 32B (320亿) 级别时,单卡显存往往难以支撑其完整运行。这时,我们需要引入多卡并行推理的概念,同时考虑服务器能否支持多卡的硬件架构等问题。本篇文章将以部署 De

lumin1020
人工智能
2025-02-14 16:56

NLLB 与 ChatGPT 双向优化:探索翻译模型与语言模型在小语种应用的融合策略

本文探讨了 NLLB 翻译模型与 ChatGPT 在小语种应用中的双向优化策略。首先介绍了 NLLB-200 的背景、数据、分词器和模型,以及其与 LLM(Large Language Model)的异同和协同关系。接着列举了实战与应用的案例,包括使用 ChatGPT 生成的样本微调 NLLB-200 和使用 NLLB-200 的翻译结果作为 LLM 的 prompt 等。通过本文的研究和实践,可以为小语种翻译模型和语言模型的融合提供一定的参考和借鉴。

vivo互联网技术
自然语言
2025-02-14 15:48

从 ClickHouse 到 Apache Doris:在网易云音乐日增万亿日志数据场景下的落地

导读:日志数据已成为企业洞察系统状态、监控网络安全及分析业务动态的宝贵资源。网易云音乐引入 Apache Doris 作为日志库新方案,替换了 ClickHouse。解决了 ClickHouse 运维复杂、不支持倒排索引的问题。目前已经稳定运行 3 个季度,规模达到 50 台服务器, 倒排索引将全文检索性能提升7倍,2PB 数据,每天新增日志量超过万亿条,峰值写入吞吐 6GB/s 。网易云音乐每天

SelectDB
国内数据库
2025-02-14 15:34

关系型数据库管理员的6项基本技能

要想成为一名优秀的关系型数据库管理员(DBA),就必须拥有一套强大的技术和战略技能工具包。本文提炼了DBA在维护关系型数据库时需要掌握的六大基本技能,从掌握 SQL 到微调性能,增强数据库管理领域的专业技能。

qing_yun
数据库开发技术
2025-02-14 14:38

混合云才是正解,公有云在AI领域的投资未达预期

首席执行官萨蒂亚·纳德拉在解释这一缺口时,揭示了一个令人深思的企业生存现状:传统的公有云模型在兑现生成式AI的承诺方面正面临严峻挑战。

danny_2018
公有云实践
2025-02-14 11:03

爱奇艺的接口治理与自动化测试一体化解决方案实践

随着云原生和微服务架构的普及,公司许多服务也转向了微服务模式,以满足业务的高速发展和高流量调用需求。然而,微服务的拆分导致API数量的爆发式增长,使得接口管理和接口质量保障的问题更加凸显,具体体现在以下几个方面

陶然陶然
服务器/存储
2025-02-14 10:36

前端 TypeError 错误消失术

通过开发 Babel 插件,打包时自动为代码添加 可选链运算符(?.),从而有效避免 TypeError 的发生。

vivo互联网技术
Javascript
2025-02-13 16:44

【元脑技术详解】改进三大关键环节,构建高精度大模型RAG知识库

在大模型技术浪潮中,检索增强生成(RAG)技术结合了大型语言模型(LLMs)的生成能力与信息检索系统,成为解决大模型“幻觉”,并高效利用企业积淀的专业知识提升智能生产力的关键方案。

lumin1020
人工智能
2025-02-13 14:34

oracle多次密码错误登录,用户锁住或失效

多次输入错误账号查询状态:select username,account_status from dba_users;TEST                   EXPIRED(GRACE) 密码错误延迟登录,延迟登录还能登录或者TEST    &

lmxx2020
Oracle
2025-02-13 14:33

湖仓分析|浙江霖梓基于 Doris + Paimon 打造实时/离线一体化湖仓架构

导读:浙江霖梓早期使用 CDH 产品套件搭建了大数据系统,面临业务逻辑冗余、查询效率低下等问题,基于 Apache Doris 进行整体架构与表结构的重构,并基于湖仓一体和查询加速展开深度探索与实践,打造了 Doris + Paimon 的实时/离线一体化湖仓架构,实现查询提速 30 倍、资源成本节省 67% 等显著成效。浙江霖梓是一家专注于深度学习和人工智能应用的金融创新企业,自 2018 年成

SelectDB
国内数据库
2025-02-13 12:05

【PGCCC】pg_squeeze 1.8:自动表膨胀清理的扩展

PostgreSQL 扩展可从表中删除未使用的空间,并可选择根据特定索引对元组进行排序(就像CLUSTER命令与常规读取/写入同时执行一样)。事实上,我们尝试替换 pg_repack扩展。虽然提供了非常相似的功能,但pg_squeeze采用了不同的方法:纯粹在服务器端实现功能。利用 PostgreSQL 数据库服务器的最新改进。虽然 (1) 使配置和使用都更简单(与使用服务器和客户端代码的pg_r

pgccc
PostgreSQL
2025-02-13 11:09

AI重塑软件开发架构,企业如何跟进AI?

甲骨文公司副总裁及中国区董事总经理吴承杨指出,2025年是AI应用快速发展的一年,这已经成为行业共识。AI是一场革命,不是一个AI项目那么简单,会影响方方面面。企业需要构建以AI为中心的平台架构来拥抱AI,“使用AI开发应用,不改变开发架构,就像在土路上驾驶赛车。”

qing_yun
数据库开发技术
2025-02-13 09:25

还在为IT运维头疼?锐捷乐享云订阅,让IT运维更简单

  在数字化转型的浪潮中,IT系统的复杂性正以惊人的速度增长。据行业调研显示,大多数企业在IT运维中面临故障定位难、效率低、成本高等问题。如何应对这些挑战,成为企业IT部门亟待解决的难题。  在此背景下,锐捷网络“乐享云订阅”服务应运而生,为客户提供持续高效的IT运维管理体验,助力企业增强灵活性并加速投资回报。  锐捷网络在 IT 运维管理领域素来表现出色,并得到了权威机构的认可。根据IDC数据报

丸喵喵
网络通信/物联网
2025-02-12 11:46

Redis 持久化原理分析和使用建议

本文主要介绍了 Redis 提供的三大持久化机制,即 AOF 日志、RDB 快照以及混合持久化机制。

vivo互联网技术
国内数据库
2025-02-12 10:19

官宣|Apache Paimon 1.0 发布公告

在后续计划中,我们重点投入 RESTCatalog 的建设,并且推动 REST Server 的发展,在未来,我们希望通过 REST 元数据服务极大的提升整个湖仓的体验、可用性和易用性。

danny_2018
数据分析
2025-02-11 18:16