给大家出一个难题，不知道坛子里有没有高手

liyubo · 发表于 2006-9-20 22:54

最初由 ZALBB 发布
[B]

抱歉，我只测试汉字是否可以转换的情况，法语没测试。
条件大致是这样的：9205， WINDOWS2003。
源数据库为：ZHS16GBK
目标数据库位：WE9ISO8859P1

两个数据库都在同一个服务器上，测试的DMP文件里包含汉字，
在测试过程中，做了两步工作：
1、确认导出没问题。导回源库OK。
2、导入目标数据库后，没报任何异常，汉字正常显示。 [/B]

其实如果你从WE9ISO8859P1导入到ZHS16GBK，也有可能遇到和我一样的问题，特别当有些域的数据（非ASCII）已经接近4000的限制的时候。如果只是测试了一个试验数据库，由于数据很小，可能不会遇到问题。

你试一下源库是WE9ISO8859P1，然后建立一个域，用VARCHAR2(4000)定义，然后输入一个包含法文（或其它非ASCII字符）的数据，并且数据的长度接近4000，例如3999等。自己手工计算一下，确保非ASCII字符数double后，总长度会超过4000。然后dmp出来，再导入到字符集为UTF8或ZHS16GBK的目标数据库，看看是否会出错。

ZALBB · 发表于 2006-9-21 08:22

1、到哪去找法文？
2、可以更改字段类型的属性，把原来按照字节计算的长度改为按照字符，可保证
导入后不超出数据类型的长度。

liyubo · 发表于 2006-9-23 05:32

最初由 ZALBB 发布
[B]1、到哪去找法文？
2、可以更改字段类型的属性，把原来按照字节计算的长度改为按照字符，可保证
导入后不超出数据类型的长度。 [/B]

2. 问题就在这里，Oracle10g里面对于VARCHAR2域的限制就是4000个byte，无论你的字符段属性是CHAR还是BYTE，这个4000的限制都是一样，就是4000个BYTE。

据各例子。当用UTF8时候，如果你所有的字符CHAR都是占2个byte的话，你总共能够输入的字符就只能是4000/2 = 2000个CHAR，而不是4000的CHAR。不论你的字符段属性是CHAR还是BYTE。

现在，法文字符在WE8ISO8859P1中占1个BYTE，到了UTF8中，就要占2个BYTE。问题就出现了。

ZALBB · 发表于 2006-9-29 11:00

最初由 liyubo 发布
[B]

2. 问题就在这里，Oracle10g里面对于VARCHAR2域的限制就是4000个byte，无论你的字符段属性是CHAR还是BYTE，这个4000的限制都是一样，就是4000个BYTE。

据各例子。当用UTF8时候，如果你所有的字符CHAR都是占2个byte的话，你总共能够输入的字符就只能是4000/2 = 2000个CHAR，而不是4000的CHAR。不论你的字符段属性是CHAR还是BYTE。

现在，法文字符在WE8ISO8859P1中占1个BYTE，到了UTF8中，就要占2个BYTE。问题就出现了。 [/B]

那你先导入表结构，然后再把这类字段类型改为CLOB，最后再导入数据库。

husthxd · 发表于 2006-9-29 17:05

最初由 ZALBB 发布
[B]

笔记还在整理之中，晚些时候再贴出。 [/B]

I am waiting.......

robixiao · 发表于 2006-9-30 11:34

cainiao2 · 发表于 2006-10-23 15:42

关注中...

LoveWinter · 发表于 2006-10-24 16:59

Two Suggestions:

S1.  Doing  a  full  database  export  and
import is  a proper  approach  to  covert  all  data  to  new  character set.

S2. Use  CSALTER  Script  when  migrating

Note: This can  be used only under  following condition:

The  database character set  itself  and
all  of  its  schema  data  must  be  a
   strict  subset  of  the  new  character  set.

因为WE8ISO8859 与AL32UTF8 本身没有从属关系,因此
可以略过.[/COLOR]

.  CLOB columns (Not  include those which belong  to  data  dictionary and  sample schemas) that created by user  should  be  first  exported  or dropped  from  schema before  this script  run.

So, I think you need to check data first,
As you pointed out, the column size of "varchar2" data type is a problematic
area, You may need to convert data type
of some columns first.

Secondly, please be carefully to set
correct NLS_LANG parameter before export
and import, which may cause corrupted data generated.

最初由 liyubo 发布
[B]是一个字符集问题

原数据库是8i, 字符集是WE8ISO8859P1。数据库中含有大量法语和英语数据。

新的数据库是10g,字符集用AL32UTF8。请问能够无损转换全部的数据吗? [/B]

h1yn · 发表于 2006-10-25 10:55

你可以把涉及到clob，或者你认为在字符集转换后出错的表先导出，然后把这些表drop掉，这个时候再次的exp出来，根据你现在需要的字符集，建新的db,，然后imp，这些步骤好了后，然后再处理有关clob，或者涉及法文的表

hgeng · 发表于 2006-10-25 22:34

See what Tom has to say:

http://asktom.oracle.com/pls/ask ... TERIA:1224836384599

给大家出一个难题，不知道坛子里有没有高手

Re: 给大家出一个难题，不知道坛子里有没有高手