大数据

微软Fabric如何推动重构AI数据认知方式

图结构通过提供清晰的起点赋能系统,能精准锁定关键要素——无论是关联特定产品的客户群体,还是序列连接的设备链条。一旦定义目标集,向量搜索便能在其中挖掘模式与意义。模型不再盲目遍历全部数据,而是聚焦于更具上下文关联的局部空间。

qing_yun
数据分析
2025-09-22 11:03

做数据十年,第一次见到这么棒的“归因模型”

数据分析领域有几个经典的终极难题。多影响因素归因,绝对是其中最让人头大的。特别业绩好的时候,品牌、售后、客服、供应链、运营、产品、商品管理都会跑来,说:“今年业绩不错呀,公司多赚的10个亿,到底几个亿归功于品牌,到底几个亿归功于供应……请量化分析一下,谢谢”。

qing_yun
数据分析
2025-09-22 10:39

数据分析的尽头是什么?跳出数据看数据!

在数据分析的世界里,终极武器不是AI,不是代码能力,也不是可视化能力,而是能够回归业务常识,跳出数据看数据。 什么是跳出数据看数据?在正式解释之前,我们先来看数据分析的四个阶段。

danny_2018
数据分析
2025-08-28 13:55

数据管理中的 4 种数据所有者类型

本文将分析数据和治理领域中最相关的四种所有者类型,解释他们各自的角色,并展示他们在实践中如何互动。虽然每个组织都应该以适合自身情况的方式定义所有权,但本文概述的模式反映了我所观察到的在各个行业和数千个组织中最有效的模式,因此可以作为一个建议的起点。

qing_yun
数据挖掘
2025-08-20 09:37

京东流量资产基于湖仓架构的落地实践

在当今数字化商业浪潮中,数据无疑是企业的核心资产,而流量数据更是电商巨头京东业务运转的关键驱动力。它广泛应用于搜索推荐、广告投放等多个核心业务场景,直接影响着用户体验和商业效益。

danny_2018
数据分析
2025-08-18 16:39

数据分析应用设计全攻略:从指标到安全,一文讲透

在如今这个“数据为王”的时代,一家企业的数据平台就像它的神经中枢,而分析应用,就是最贴近业务、直接对接用户的“前端大脑”。

danny_2018
数据分析
2025-08-11 09:14

7大类型常见产品核心数据指标梳理

但很多新人产品经理在做产品或运营活动效果复盘时,往往不知道要看什么指标。尤其是对于一些B端中后台产品,在做项目复盘或者简历项目描述时,不知道该如何量化收益结果。因此,基于不同类型的产品,整理了一些日常需要关注的核心指标,供参考,实操过程,需要基于战略目标确定核心的北极指标,以及其他可以全面准确反映业务健康度的数据指标。

qing_yun
数据分析
2025-08-08 13:47

Snowflake将Apache Spark无缝迁移至云数据平台

今天,Snowflake 正式推出 Snowpark Connect for Apache Spark 预览版,这意味着该公司在统一数据分析平台道路上迈出关键一步。新功能旨在通过将 Apache Spark 分析工作负载直接迁移到 Snowflake 数据云内部运行,可显著降低延迟,简化原来在架构上的复杂性,并从整体上提升分析效率。

danny_2018
数据分析
2025-07-30 11:17

物流行业核心数据指标

物流行业核心数据指标有哪些?总体包括客户服务指标、运营效率指标、业务规模指标、成本与财务指标、可持续发展指标等等

qing_yun
数据分析
2025-07-28 13:53

vivo Pulsar 万亿级消息处理实践(3)-KoP指标异常修复

Apache Pulsar通过KoP兼容Kafka协议,使Kafka应用能无缝迁移至Pulsar,保留其生态优势,并提升性能、兼容性和可扩展性。vivo在使用Pulsar KoP的过程中遇到过一些问题,本篇主要分享一个分区消费指标缺失的问题。

vivo互联网技术
数据挖掘
2025-07-10 10:34

用友ChatBI重构企业数据价值的智能引擎

在AI技术浪潮席卷全球企业的背景下,很多企业都在卷ChatBI这个细分赛道。那么,对于中国管理软件的领头羊用友来说,到底怎么看?在《AI数据分析之ChatBI发展与应用实践》白皮书撰写期间,笔者有幸采访了用友数据事业部负责人李进闯。在他看来,ChatBI正以对话式交互模式重构数据分析格局。

danny_2018
数据分析
2025-07-09 11:07

定制化BI可视化产品还能活多久?

结合近期数据产品求职辅导部分同学对于BI分析方向的数据产品的岗位理解偏差,总结下定制化可视化报表产品和自助BI产品的爱恨情仇。

qing_yun
数据分析
2025-07-07 11:15

流湖再进化,腾讯云Setats破解实时处理“不可能三角”

在AI技术创新浪潮下,大数据的底层架构也在加速迭代。满足未来数据处理需求的技术架构到底什么样?腾讯云大数据团队在流湖领域的创新,可以说是取得了开创性成果。

danny_2018
数据挖掘
2025-06-25 18:26

加速推动AI与数据的融合,Databricks发力Lakeflow Designer

Lakeflow Designer的的“谋篇布局”,标志着Databricks正从单纯的数据湖仓平台,向AI驱动的数据操作层延伸。通过平衡易用性与治理能力,其有望助力企业突破数据工程“最后一公里”的瓶颈,真正释放数据与AI的融合价值。

danny_2018
数据分析
2025-06-16 15:34

vivo Pulsar 万亿级消息处理实践(2)-从0到1建设 Pulsar 指标监控链路

本文是《vivo Pulsar万亿级消息处理实践》系列文章第2篇,Pulsar支持上报分区粒度指标,Kafka则没有分区粒度的指标,所以Pulsar的指标量级要远大于Kafka。在Pulsar平台建设初期,提供一个稳定、低时延的监控链路尤为重要。

vivo互联网技术
Spark
2025-06-12 10:52