查看: 37779|回复: 43

[精华] ITPUB知识索引贴——全文索引

[复制链接]
论坛徽章:
226
BLOG每日发帖之星
日期:2010-02-11 01:01:06紫蛋头
日期:2013-01-12 23:45:222013年新春福章
日期:2013-02-25 14:51:24问答徽章
日期:2013-10-17 18:06:40优秀写手
日期:2013-12-18 09:29:10马上有车
日期:2014-02-19 11:55:14马上有房
日期:2014-02-19 11:55:14马上有钱
日期:2014-02-19 11:55:14马上有对象
日期:2014-02-19 11:55:14马上加薪
日期:2014-02-19 11:55:14
跳转到指定楼层
1#
发表于 2010-6-15 13:42 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
Oracle Text是一个允许用户构建文本查询应用程序或文档分类应用程序的工具。Oracle Text提供文本索引、词或主体的查询等功能。

Oracle的文本查询应用程序支持文本格式文档、HTML、XML和微软的WORD文档等多种类型。
对于英语和法语,还支持文章主体查询。

Oracle Text支持的文档的存储位置包括:
直接存储在列中;
文档存储在操作系统中,列中存储文档的路径和名称;
文档存储在互联网上,列中存储文档的URLs。
Oracle Text支持的列的类型:VARCHAR2、CHAR、CLOB、BLOB、BFILE、XMLTYPE和URITYPE。

索引类型:
CONTEXT:操作符为CONTAINS。主要用于索引较大的文档,支持多种文档类型。
CTXCAT:操作符为CATSEARCH。主要用于提高混合查询性能,适合具有一定结构的小的文本片断。
CTXRULE:操作符为MATCHES。主要用于文档分类。
论坛徽章:
226
BLOG每日发帖之星
日期:2010-02-11 01:01:06紫蛋头
日期:2013-01-12 23:45:222013年新春福章
日期:2013-02-25 14:51:24问答徽章
日期:2013-10-17 18:06:40优秀写手
日期:2013-12-18 09:29:10马上有车
日期:2014-02-19 11:55:14马上有房
日期:2014-02-19 11:55:14马上有钱
日期:2014-02-19 11:55:14马上有对象
日期:2014-02-19 11:55:14马上加薪
日期:2014-02-19 11:55:14
2#
 楼主| 发表于 2010-6-15 13:48 | 只看该作者
CONTENT索引建立

DATASTORE部分:
ORACLE TEXT DATASTORE PREFERENCE(一):介绍DIRECT_DATASTORE。
ORACLE TEXT DATASTORE PREFERENCE(二):介绍MULTI_COLUMN_DATASTORE。
ORACLE TEXT DATASTORE PREFERENCE(三):介绍FILE_DATASTORE。
ORACLE TEXT DATASTORE PREFERENCE(四):介绍URL_DATASTORE。
ORACLE TEXT DATASTORE PREFERENCE(五):介绍DETAIL_DATASTORE。
ORACLE TEXT DATASTORE PREFERENCE(六):介绍NESTED_DATASTORE。
ORACLE TEXT DATASTORE PREFERENCE(七):介绍USER_DATASTORE。


FILTER部分:
ORACLE TEXT FILTER PREFERENCE(一):介绍NULL_FILTER。
ORACLE TEXT FILTER PREFERENCE(二):介绍INSO_FILTER。
ORACLE TEXT FILTER PREFERENCE(三):介绍FILTER的FORMAT列。
ORACLE TEXT FILTER PREFERENCE(四):介绍PROCEDURE_FILTER。


LEXER部分:
ORACLE TEXT LEXER PREFERENCE(一):介绍BASIC_LEXER。
ORACLE TEXT LEXER PREFERENCE(二):介绍CHINESE_VGRAM_LEXER和CHINESES_LEXER。
ORACLE TEXT LEXER PREFERENCE(三):介绍MULTI_LEXER。
ORACLE TEXT LEXER PREFERENCE(四):介绍DEFAULT_LEXER。


WORDLIST部分:
ORACLE TEXT WORDLIST PREFERENCE:介绍BASIC_WORDLIST。


STORAGE部分:
ORACLE TEXT STORAGE PREFERENCE:介绍BASIC_STORAGE。


SECTION GROUP部分:
ORACLE TEXT SECTION GROUP PREFERENCE(一):介绍NULL_SECTION。
ORACLE TEXT SECTION GROUP PREFERENCE(二):介绍BASIC_SECTION_GROUP。
ORACLE TEXT SECTION GROUP PREFERENCE(三):介绍HTML_SECTION_GROUP。
ORACLE TEXT SECTION GROUP PREFERENCE(四):介绍XML_SECTION_GROUP。
ORACLE TEXT SECTION GROUP PREFERENCE(五):介绍AUTO_SECTION_GROUP。
ORACLE TEXT SECTION GROUP PREFERENCE(六):介绍PATH_SECTION_GROUP。


STOPLIST部分:
ORACLE TEXT STOPLIST PREFERENCE(一):介绍BASIC_STOPLIST。
ORACLE TEXT STOPLIST PREFERENCE(二):介绍EMPTY_STOPLIST。
ORACLE TEXT STOPLIST PREFERENCE(三):介绍DEFAULT_STOPLIST。
ORACLE TEXT STOPLIST PREFERENCE(四):介绍MULTI_STOPLIST。






使用道具 举报

回复
论坛徽章:
226
BLOG每日发帖之星
日期:2010-02-11 01:01:06紫蛋头
日期:2013-01-12 23:45:222013年新春福章
日期:2013-02-25 14:51:24问答徽章
日期:2013-10-17 18:06:40优秀写手
日期:2013-12-18 09:29:10马上有车
日期:2014-02-19 11:55:14马上有房
日期:2014-02-19 11:55:14马上有钱
日期:2014-02-19 11:55:14马上有对象
日期:2014-02-19 11:55:14马上加薪
日期:2014-02-19 11:55:14
3#
 楼主| 发表于 2010-6-15 13:50 | 只看该作者
CTXCAT索引和CTXRULE索引

CTXCAT相关:
ORACLE TEXT INDEX SET:介绍CTXCAT索引的INDEXSET。
全文索引查询模板的使用:如何对CTXCAT索引中使用CONTEXT索引语法。


CTXRULE索引:
暂缺

[ 本帖最后由 yangtingkun 于 2010-6-15 13:53 编辑 ]

使用道具 举报

回复
论坛徽章:
226
BLOG每日发帖之星
日期:2010-02-11 01:01:06紫蛋头
日期:2013-01-12 23:45:222013年新春福章
日期:2013-02-25 14:51:24问答徽章
日期:2013-10-17 18:06:40优秀写手
日期:2013-12-18 09:29:10马上有车
日期:2014-02-19 11:55:14马上有房
日期:2014-02-19 11:55:14马上有钱
日期:2014-02-19 11:55:14马上有对象
日期:2014-02-19 11:55:14马上加薪
日期:2014-02-19 11:55:14
4#
 楼主| 发表于 2010-6-15 13:52 | 只看该作者
全文索引查询语法相关:

Oracle Text About操作:介绍全文索引ABOUT操作。
全文索引停用词:停用词对全文索引查询的影响。
全文索引查询模板的使用:如何对CTXCAT索引中使用CONTEXT索引语法。

全文索引查询——常用且容易混淆的查询操作(一):AND、OR、ACCUM等易混淆操作的说明。

全文索引查询——常用且容易混淆的查询操作(二):NOT和MINUS的区别。





使用道具 举报

回复
论坛徽章:
226
BLOG每日发帖之星
日期:2010-02-11 01:01:06紫蛋头
日期:2013-01-12 23:45:222013年新春福章
日期:2013-02-25 14:51:24问答徽章
日期:2013-10-17 18:06:40优秀写手
日期:2013-12-18 09:29:10马上有车
日期:2014-02-19 11:55:14马上有房
日期:2014-02-19 11:55:14马上有钱
日期:2014-02-19 11:55:14马上有对象
日期:2014-02-19 11:55:14马上加薪
日期:2014-02-19 11:55:14
5#
 楼主| 发表于 2010-6-15 13:54 | 只看该作者
全文索引相关包:

全文索引文档显示——过滤(一):介绍CTX_DOC包的FILTER过程。
全文索引文档显示——过滤(二):介绍CTX_DOC包的IFILTER过程。
全文索引文档显示——高亮显示:介绍CTX_DOC包的HIGHT_LIGHT过程。
全文索引文档显示——标注:介绍CTX_DOC包的MARKUP过程。
全文索引文档显示——主题:介绍CTX_DOC包的THEMES过程。
全文索引文档显示——摘要:介绍CTX_DOC包的GIST过程。

使用道具 举报

回复
论坛徽章:
226
BLOG每日发帖之星
日期:2010-02-11 01:01:06紫蛋头
日期:2013-01-12 23:45:222013年新春福章
日期:2013-02-25 14:51:24问答徽章
日期:2013-10-17 18:06:40优秀写手
日期:2013-12-18 09:29:10马上有车
日期:2014-02-19 11:55:14马上有房
日期:2014-02-19 11:55:14马上有钱
日期:2014-02-19 11:55:14马上有对象
日期:2014-02-19 11:55:14马上加薪
日期:2014-02-19 11:55:14
6#
 楼主| 发表于 2010-6-15 13:55 | 只看该作者
全文索引性能相关:
全文索引性能分析(一):整体分析。
全文索引性能分析(二):统计信息对全文索引性能影响。
全文索引性能分析(三):直方图对全文索引性能影响。
全文索引性能分析(四):多个全文索引查询条件的情况。
全文索引性能分析(五):包含两个全文索引查询字段的情况。
全文索引性能分析(六):两张关联表都包含全文索引查询的情况。
全文索引性能分析(七):继续讨论两张关联表都包含全文索引查询的情况,并给出解决方案。
全文索引性能分析(八):进一步深入探讨上一篇给出的解决方案,利用节搜索解决了解决方案中存在的逻辑问题。
CONTEXT索引对COMMIT操作的影响:建立了CONTEXT索引后,COMMIT操作会进行一些额外的操作。

使用道具 举报

回复
论坛徽章:
226
BLOG每日发帖之星
日期:2010-02-11 01:01:06紫蛋头
日期:2013-01-12 23:45:222013年新春福章
日期:2013-02-25 14:51:24问答徽章
日期:2013-10-17 18:06:40优秀写手
日期:2013-12-18 09:29:10马上有车
日期:2014-02-19 11:55:14马上有房
日期:2014-02-19 11:55:14马上有钱
日期:2014-02-19 11:55:14马上有对象
日期:2014-02-19 11:55:14马上加薪
日期:2014-02-19 11:55:14
7#
 楼主| 发表于 2010-6-15 13:56 | 只看该作者
全文索引灵活运用:
如何对LONG列进行查询:给出查询LONG字段的几种方法。
利用Oracle的全文索引实现切词功能:借用Oracle的功能来实现切词功能。
利用Oracle的全文索引实现切词功能(二):对前两天给出的实现进行了一些修改,考虑了并发性,并降低执行成本。
利用Oracle的全文索引实现切词功能(三):利用10g的新特性的解决方法。

使用道具 举报

回复
论坛徽章:
226
BLOG每日发帖之星
日期:2010-02-11 01:01:06紫蛋头
日期:2013-01-12 23:45:222013年新春福章
日期:2013-02-25 14:51:24问答徽章
日期:2013-10-17 18:06:40优秀写手
日期:2013-12-18 09:29:10马上有车
日期:2014-02-19 11:55:14马上有房
日期:2014-02-19 11:55:14马上有钱
日期:2014-02-19 11:55:14马上有对象
日期:2014-02-19 11:55:14马上加薪
日期:2014-02-19 11:55:14
8#
 楼主| 发表于 2010-6-15 13:57 | 只看该作者
全文索引的相关bug:

ANALYZE的ESTIMATE语法处理全文索引的bug:ANALYZE的ESTIMATE语法在分析全文索引表时的问题。
FLASHBACK TABLE对全文索引的影响:FLASHBACK TABLE对全文索引的支持还有问题。
域索引提示无效:域索引提示DOMAIN_INDEX_SORT和DOMAIN_INDEX_NO_SORT无效。
通过数据库链执行TEXT操作的小bug:通过数据库链执行TEXT操作的小bug。
64位环境AUTO_FILTER和INSO_FILTER失效的问题:64位环境的AUTO_FILTER存在bug。

使用道具 举报

回复
论坛徽章:
226
BLOG每日发帖之星
日期:2010-02-11 01:01:06紫蛋头
日期:2013-01-12 23:45:222013年新春福章
日期:2013-02-25 14:51:24问答徽章
日期:2013-10-17 18:06:40优秀写手
日期:2013-12-18 09:29:10马上有车
日期:2014-02-19 11:55:14马上有房
日期:2014-02-19 11:55:14马上有钱
日期:2014-02-19 11:55:14马上有对象
日期:2014-02-19 11:55:14马上加薪
日期:2014-02-19 11:55:14
9#
 楼主| 发表于 2010-6-15 14:02 | 只看该作者
占个位置,扩展预留

使用道具 举报

回复
论坛徽章:
16
授权会员
日期:2005-11-01 10:49:02ITPUB十周年纪念徽章
日期:2011-09-27 16:30:472011新春纪念徽章
日期:2011-02-18 11:43:322010年世界杯参赛球队:南非
日期:2010-05-12 11:08:572010新春纪念徽章
日期:2010-03-01 11:04:542009新春纪念徽章
日期:2009-01-04 14:52:28生肖徽章2007版:狗
日期:2008-10-31 12:50:13生肖徽章2007版:狗
日期:2008-10-24 18:01:04奥运会纪念徽章:排球
日期:2008-10-24 13:30:01生肖徽章2007版:狗
日期:2008-10-20 14:41:16
10#
发表于 2010-6-15 15:35 | 只看该作者
辛苦了

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

TOP技术积分榜 社区积分榜 徽章 团队 统计 知识索引树 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档
  ChinaUnix | ChinaUnix博客 | ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 未成年人举报专区 
京ICP备16024965号-8  北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表