IT基础架构

腾讯PCG搜广推机器学习框架GPU性能优化实践

最开始的时候,腾讯 PCG 所有的推荐模型训练都是使用 CPU。但随着业务的深入,以及深度学习模型的发展,PCG 算力集群在做下一代推荐模型时会遇到各种问题:首先,系统网络带宽小,不稳定。另外,很多推荐模型都很大,我们要考虑用多机多卡还是单机多卡,这就涉及到硬件的选型。

陶然陶然
服务器/存储
2024-05-11 10:06

前端统一请求库设计与落地

对于一个前端工程师而言,每天都在面对的较多的需求场景就是调用后端的接口,但是因为众所周知的原因,前端目前已经有无数种调用接口的方式,例如:之前有基于 XHR、Axios、Fetch 进行封装的工具,大家都试图在统一接口的调用方式,但是他们看起来最后都需要再进行改造。于是,我们试图在 B 站开发一套能够综合上述工具之长处,并结合 B 站事实需要的工具, 推出一个具有统一错误处理、减少代码冗余、抹平风格差异、降低文档负担、优化代码提示等功能的统一请求库。

架构师修行手册
服务器/存储
2024-05-10 11:12

微服务部署最全详解(4种主流部署模式)

微服务部署是微服务非常重要的环节,也是构建微服务的基石,下面详解4种主流的微服务部署模式

张哥说技术
服务器/存储
2024-05-10 09:22

Twitter如何改进4000亿事件实时处理架构?

Twitter每日需实时处理高达4000亿的事件,并生成PB级的数据。这些数据主要来源于分布式数据库、Kafka以及Twitter事件总线等多种事件源。接下来,我们将深入探讨Twitter在事件处理方面的演变,具体包括以下方面:

陶然陶然
服务器/存储
2024-05-09 14:04

得物质量管理体系的建设与应用

目录 一、背景 二、建设“四化”体系 三、机制的目标与框架 四、流程与规范 五、方法与工具 六、聚焦“关键词” 七、总结

架构师修行手册
服务器/存储
2024-05-09 10:12

XSKY SDS 6.4 重磅更新:NFS 性能飙升 3 倍,对象多站点等 10 多项功能强势升级

  近日,XSKY星辰天合发布了 XSKY SDS V6.4 新版本,该版本在文件的性能提升、对象容灾能力完善方面改进异常显著,同时也大幅提高了存储系统的安全特性,适配更多的信创软硬件生态。

云计算频道
服务器/存储
2024-05-08 18:30

新旧机房一起管,3000点桌面的“云”化之旅

提到机房管理的“痛”,相信各高职院校信息中心的老师们都深有感触。  云南现代职业技术学院(下文简称“学院”)是一所国家公办的高等职业院校。随着教育数字化浪潮席卷而来,计算机机房成为教学中不可或缺的一环。除了承接计算机课程的公共机房外,几乎每个学院都有多个自己的教学机房。各学院的需求越来越多,计算机数量也随之攀升,面临的挑战也日益严峻。  来自五湖四海的“老家伙”  由于学院机房建设时间不一,计算机

丸喵喵
网络通信/物联网
2024-05-08 10:49

微服务架构中的挑战及应对方式:Outbox 模式

如果您的系统满足事务性 Outbox 模式的要求,那么它可以是解决双写问题的一种简单有效的方法。与其他选项(例如事件溯源或监听自己模式)相比,这种方法采用事件优先的方法,使用 Kafka 实时通知微服务变更,保持系统一致性。但是,诸如订单履行之类的组件可能需要编排,无法运行。

码农谈IT
服务器/存储
2024-05-08 10:45

戴尔液冷:为AI这颗“种子”注入可持续发展动力

本期,我们有幸采访到了戴尔科技集团大中华区信息基础架构解决方案事业部资深总监席与琛,跟席老师一起畅聊了关于液冷服务器的技术趋势、机遇挑战、创新产品等多个方向,分享了戴尔科技在液冷服务器方面的最新进展。

陶然陶然
服务器/存储
2024-05-08 10:05

得物质量管理体系的建设与应用

质量保障是一门基于软件测试的系统化工程,遵循渐进式的发展规律。通过因地制宜地制定落地策略,设计场景方案,获取试验结果,并加以循环往复。最终,在每一位得物测试工程师的共同努力下,积累出一套适应得物技术的质量保障方法论,即本文介绍的得物质量管理体系。

陶然陶然
服务器/存储
2024-05-07 14:47

先进制造业数字化转型,为什么基于传统存储无法完成?

本文是 XSKY 智能存储方案助力先进制造数字化转型系列文章中的第一篇,重点分享先进制造行业数字化转型过程中,对于数据存储的需求,以及为何传统存储架构无法很好满足这些需求。

云计算频道
服务器/存储
2024-05-07 11:48

B站数据中心网络布线智慧管理平台实践

前期我们详细介绍了B站在定制化数据中心(R2-AZ2)项目上的探索,主要集中在智慧节能数据中心的技术迭代和实施情况。数据中心的高效运作并非孤立存在,它依赖于复杂而精细的互联互通网络,确保数据中心内的服务器、存储和网络设备间的连接。

陶然陶然
服务器/存储
2024-05-06 13:31

B站数据中心网络布线智慧管理平台实践(一)

布线系统作为大型数据中心的关键基础设施之一,如何利用数字化管理工具提高其交付及运维管理效率,也是我们一直在思考的问题和探索实践的方向。

架构师修行手册
服务器/存储
2024-05-06 10:34

HTTP 协议是怎么来的?最开始是什么样子?又是如何一步步发展 HTTP3

HTTP 协议在我们身边随处可见,只要上网就离不开它。不论是用浏览器还是 App,不论是看新闻、短视频还是听音乐、玩游戏,后面总会有 HTTP 在默默为你服务。

码农谈IT
网络安全
2024-05-06 10:33