请
登录
后使用快捷导航
没有帐号?
注册
登录
注册
快捷导航
首页
论坛
BBS
博客
技术栈
ITPUB学院
名人堂
版主团
搜索
高级搜索
热搜:
oracle
SAP
sap
二维码
dba
Oracle
c++
C++
CRM
银联信息中心
比特币
小额贷款
贷款
crm
ORACLE
项目管理系统
thread
android
python
java
本版
文章
帖子
用户
ITPUB论坛-专业的IT技术社区
»
论坛
›
≡ 软件工程与项目管理 ≡
›
算法讨论与研究
›
并行算法 : 现状与前景
1
2
3
4
5
6
7
8
9
/ 9 页
下一页
返回列表
楼主:
oraclelang
收藏
|
并行算法 : 现状与前景
[复制链接]
oraclelang
oraclelang
当前离线
积分
101
IP卡
狗仔卡
论坛徽章:
4
11
#
楼主
|
发表于 2006-4-27 10:32
|
只看该作者
例子:
a. 根据购买模式,估计一个家庭的孩子个数
b. 根据购买模式,估计一个家庭的收入
c. 估计real estate的价值
使用道具
举报
回复
显身卡
oraclelang
oraclelang
当前离线
积分
101
IP卡
狗仔卡
论坛徽章:
4
12
#
楼主
|
发表于 2006-4-27 10:32
|
只看该作者
一般来说,估值可以作为分类的前一步工作。给定一些输入数据,通过估值,得到未知的连续变量的值,然后,根据预先设定的阈值,进行分类。例如:银行对家庭贷款业务,运用估值,给各个客户记分(Score 0~1)。然后,根据阈值,将贷款级别分类。
使用道具
举报
回复
显身卡
oraclelang
oraclelang
当前离线
积分
101
IP卡
狗仔卡
论坛徽章:
4
13
#
楼主
|
发表于 2006-4-27 10:32
|
只看该作者
预言(Prediction)
通常,预言是通过分类或估值起作用的,也就是说,通过分类或估值得出模型,该模型用于对未知变量的预言。从这种意义上说,预言其实没有必要分为一个单独的类。
预言其目的是对未来未知变量的预测,这种预测是需要时间来验证的,即必须经过一定时间后,才知道预言准确性是多少。
使用道具
举报
回复
显身卡
oraclelang
oraclelang
当前离线
积分
101
IP卡
狗仔卡
论坛徽章:
4
14
#
楼主
|
发表于 2006-4-27 10:33
|
只看该作者
相关性分组或关联规则(Affinity grouping or association rules)
决定哪些事情将一起发生。
例子:
a. 超市中客户在购买A的同时,经常会购买B,即A => B(关联规则)
b. 客户在购买A后,隔一段时间,会购买B (序列分析
使用道具
举报
回复
显身卡
oraclelang
oraclelang
当前离线
积分
101
IP卡
狗仔卡
论坛徽章:
4
15
#
楼主
|
发表于 2006-4-27 10:33
|
只看该作者
聚集(Clustering)
聚集是对记录分组,把相似的记录在一个聚集里。聚集和分类的区别是聚集不依赖于预先定义好的类,不需要训练集
使用道具
举报
回复
显身卡
oraclelang
oraclelang
当前离线
积分
101
IP卡
狗仔卡
论坛徽章:
4
16
#
楼主
|
发表于 2006-4-27 10:33
|
只看该作者
例子:
a. 一些特定症状的聚集可能预示了一个特定的疾病
b. 租VCD类型不相似的客户聚集,可能暗示成员属于不同的亚文化群
聚集通常作为数据挖掘的第一步。例如,“哪一种类的促销对客户响应最好?”,对于这一类问题,首先对整个客户做聚集,将客户分组在各自的聚集里,然后对每个不同的聚集,回答问题,可能效果更好。
使用道具
举报
回复
显身卡
oraclelang
oraclelang
当前离线
积分
101
IP卡
狗仔卡
论坛徽章:
4
17
#
楼主
|
发表于 2006-4-27 10:33
|
只看该作者
描述和可视化(Description and Visualization)
是对数据挖掘结果的表示方式。
使用道具
举报
回复
显身卡
oraclelang
oraclelang
当前离线
积分
101
IP卡
狗仔卡
论坛徽章:
4
18
#
楼主
|
发表于 2006-4-27 10:34
|
只看该作者
3.数据挖掘的技术背景
1)数据挖掘技术包括三个主要部分:算法和技术;数据;建模能力
2)数据挖掘和机器学习(Machine Learning)
使用道具
举报
回复
显身卡
oraclelang
oraclelang
当前离线
积分
101
IP卡
狗仔卡
论坛徽章:
4
19
#
楼主
|
发表于 2006-4-27 10:34
|
只看该作者
机器学习是计算机科学和人工智能AI发展的产物
机器学习分为两种学习方式:自组织学习(如神经网络);从例子中归纳出规则(如决策树)
数据挖掘由来
使用道具
举报
回复
显身卡
oraclelang
oraclelang
当前离线
积分
101
IP卡
狗仔卡
论坛徽章:
4
20
#
楼主
|
发表于 2006-4-27 10:34
|
只看该作者
数据挖掘由来
数据挖掘是八十年代,投资AI研究项目失败后,AI转入实际应用时提出的。它是一个新兴的,面向商业应用的AI研究。选择数据挖掘这一术语,表明了与统计、精算、长期从事预言模型的经济学家之间没有技术的重叠
使用道具
举报
回复
显身卡
1
2
3
4
5
6
7
8
9
/ 9 页
下一页
返回列表
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
注册
本版积分规则
发表回复
回帖后跳转到最后一页
TOP
技术积分榜
社区积分榜
徽章
团队
统计
知识索引树
积分竞拍
文本模式
帮助
ITPUB首页
|
ITPUB论坛
|
数据库技术
|
企业信息化
|
开发技术
|
微软技术
|
软件工程与项目管理
|
IBM技术园地
|
行业纵向讨论
|
IT招聘
|
IT文档
ChinaUnix
|
ChinaUnix博客
|
ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有
联系我们
未成年人举报专区
京ICP备16024965号-8
北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
快速回复
返回顶部
返回列表