自动化运维

提升工作效率!如何巧用 Ansible 实现自动化运维?

Ansible 是一种开源的自动化运维工具,它基于 YAML 语言编写 playbook,可以用来自动化服务器的配置、部署和管理。Ansible 使用 SSH 协议进行通信,可以在大量服务器上进行批量操作,无需在目标服务器上安装任何客户端软件。它支持多种操作系统,包括 Linux、Windows、Mac OS X 等。Ansible 可以用来自动化各种任务,例如安装软件、配置服务、备份数据、部署应

Linksla
大规模网络运维
2023-09-26 09:41

Kafka 运维必懂:从原理到调优,看完秒变大佬

1 Kafka 概述Kafka 起初是 由 LinkedIn 公司采用 Scala 语言开发的一个多分区、多副本且基于 ZooKeeper 协调的分布式消息系统,现已被捐献给 Apache 基金会。目前 Kafka 已经定位为一个分布式流式处理平台,它以高吞吐、可持久化、可水平扩展、支持流数据处理等多种特性而被广泛使用,主要是由 Scala 和 Java 编写。它是一种高吞吐量的分布式发布订阅消息

Linksla
大规模网络运维
2023-09-25 09:21

Appilot发布:打造面向DevOps场景的开源AI助手

面向 DevOps 场景的 Al 助手 Appilot 正式发布!

Seal数澈
DevOps
2023-09-20 12:13

集成学习方法——随机森林

之前我们介绍过决策树,随机森林(Random Forest)是将多个决策树(Decision Tree)组合在一起形成一个强大的分类器或回归器,是一种集成学习(Ensemble Learning)方法。随机森林的主要思想是通过随机选择样本和特征来构建多个决策树,并通过集成这些决策树的预测结果来达到更准确的分类或回归结果。具体步骤如下:随机选择部分训练样本集;随机选择部分特征子集;构建决策树,对每个

小魏技术
应用服务器
2023-09-19 11:28

避免90%以上IT故障,医院运维效率狂飙

01故障发现到解决,仅用15分钟一、问题描述上午11点半左右,平台接到医院某软件PACS+数据库离线和CPU使用率异常告警。(告警信息)(告警详情)二、查找问题的原因cpu使用率时序图从CPU使用率时序图中,可以看到11点33分左右,CPU使用率迅速从20%左右增长到100%。因为操作系统的CPU资源不足,导致SQL Server数据库软件不能正常工作,平台检测不到数据库运维参数,生成离线告警。三

Linksla
大规模网络运维
2023-09-12 17:52

微服务井喷时代,我们如何规模化运维?

随着云原生技术发展及相关技术被越来越多运用到公司生产实践当中,有两种不可逆转的趋势:

运维实践派
应用服务器
2023-09-08 11:39

从软件工程师角度聊聊 Kubernetes

一起了解 Kubernetes(K8s) 的动机、原理和核心组件。

Seal数澈
大规模网络运维
2023-09-08 10:23

Seal梁胜:近水楼台先得月,IT人员应充分利用AI解决问题

Al 技术可以帮助 DevOps 工程师减轻工作量。

Seal数澈
DevOps
2023-09-06 11:08

运维浅聊容灾演练

那么面对多数据中心,我们当前的应用架构应该如何演进呢?这个答案不是我这个运维能够解答的,但是这不妨我们去参考一些过来人的案例,例如「携程的Apollo」 。

运维实践派
大规模网络运维
2023-09-04 10:02

DORA指标:公司业务成果的“占卜师”

从DORA指标出发,一起探索 DevOps 实践与业务成果之间的预测联系。

Seal数澈
DevOps
2023-08-30 10:02

DevOps级 和 CMDB级流水线其实是不一样的!

近期听了几场关于DevOps的交流,作为运维当然是对流水线这块比较关注了。虽然大家都比较关注的是项目协同和研发流程、开箱即用及可扩展的流水线等的结合,但我思考的是这是否已经足够满足我们目前的需求了呢?为什么这么说呢?因为我们有CMDB,而且CMDB级 和 DevOps级的流水线管理其实是不一样的。

运维实践派
DevOps
2023-08-28 10:13

Stack Overflow开发者调查发布:AI将如何协助DevOps

本文将重点介绍 Stack Overflow 发布的2023年度开发人员调查报告中的几项重要发现,即重要编程语言和工具偏好、人工智能在开发工作流程中的应用以及这些趋势对 DevOps 领域可能意味着什么。

Seal数澈
DevOps
2023-08-28 09:33

推荐工具!使终端便于 DevOps 和 Kubernetes 使用

本文将为您推荐帮助用户在 DevOps和 Kubernetes 中从容浏览终端的优秀工具。

Seal数澈
DevOps
2023-08-14 11:07

新环境下的运维体系搭建

数字化转型的背景下,运维环境和技术实现发生很大变化。一、运维环境发生哪些变化?例如业务上云,运维环境就发生变化,包括运维对象,运维流程和运维工具。首先运维对象在机房动环、物理设备基础上增加了虚拟机、云平台、容器、PaaS组件、应用系统等软件层面的元素;运维流程从以故障和事件为触发的被动响应模式向以应用持续稳定运行为目标的主动防御模式转型;运维工具从监控和处置分离的简单工具时代向以全流程监控、联动处

Linksla
大规模网络运维
2023-08-10 15:35

GitOps 与 DevOps:了解关键差异,为企业做出优选

DevOps和 GitOps 之间的关系是什么? 哪种方法更适合你的企业采用?

Seal数澈
DevOps
2023-08-09 10:01

DevOps最佳实践和工具在本地环境中的概述

最近,我进行了一次网上搜索,以寻找DevOps的概述,尽管有大量的DevOps工具和实践,但我无法找到一个综合的概述。因此,我开始了对DevOps生态系统和最佳实践的梳理,以创建一个整体视图,方便后续研究实践

张哥说技术
DevOps
2023-08-08 10:11

高效构建 vivo 企业级网络流量分析系统

网络状况的良好与否直接关系到企业的日常收益。如何快速发现网络问题与定位异常流量已经成为大型企业内必须优先解决的问题,诸多网络流量分析技术也同时应运而生。

vivo互联网技术
大规模网络运维
2023-08-04 10:19

案例分享|从发现到处理,15分钟故障解决

用户的应用软件比较多,软件工程师数量比较少,日常问题都处理不过来,未能及时发现PACS+数据库离线问题。接入LinkSLA智能运维管家平台后,平台MOC工程师在数据库卡死的第一时间联系用户工程师,卫宁PACS+数据库异常,并协助现场工程师进一步检查SQL server数据库。最终锁定是数据库占用CPU资源未释放,将数据库使用资源情况做限定。问题得到解决。

Linksla
大规模网络运维
2023-08-02 11:00

人工智能如何应对 DevOps 监控和可观测性挑战

本文将为您介绍人工智能(AI)如何通过分析日志和指标来预测潜在的系统故障或性能下降,从而实现主动维护和问题解决。

Seal数澈
DevOps
2023-08-01 09:51

企业级IT应用运维监控层次架构设计

企业基本都有自己的IT系统,而每个IT系统都有自己的监控系统。企业级的IT应用监控架构是一种综合性的解决方案,涉及到很多层级和相应的工具。随着企业IT系统的规模和复杂程度的不断增加,监控和管理系统也面临着越来越大的挑战。大家有时在建立监控时,不知道从何处入手;有时建立监控系统后,发现很多的盲点无法监控到。本文将分享IT应用运维监控的基本原理、通用监控体系和应用场景、监控平台设计、智能监控的实现方法

Linksla
大规模网络运维
2023-07-31 11:24
联系我们

商务合作:

Tel: +86-15801238530

Email:sales@itpub.net

媒体合作:

Email:edit@it168.com

关注公众号获取更多技术文章