`
wsql
  • 浏览: 11797106 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
文章分类
社区版块
存档分类
最新评论

如何用SQLLDR导入unicode格式文件到数据库

 
阅读更多

要把unicode格式(其中有UTF16编码与UTF8编码的)的文件导入数据庫,除了在control文件中设定一般
的参数之外,另外还要加入下面两个参数。

CHARACTERSET : 它指明你的导入文件是什么格式的,可以是UTF16,UTF8. 如果这里指定的编码方式与你
导入的文件不相符导入会出错。
例如: CHARACTERSET 'UTF16'

LENGTH : 此参数是接着放在CHARACTERSET参数之后的,Oracle字符字段的长度可以是BYTE或CHARACTER,
如果你的导入文件是多字节字符集的,此参数要设定为CHARACTER,否则在导入时会因长度不够会被reject.
LENGTH CHARACTER

另外对于UTF16的文件,SQLLDR默认是CHARACTER,所以在control文件里不设定也不会有问题,对于文件开头
带Unicode Signature (BOM -Byte Order)Mark的,SQLLDR也是可以正确处理的.


CONTROL文件1

LOAD DATA
CHARACTERSET 'UTF16'
BADFILE 'sample.bad'
DISCARDFILE 'sample.dsc'
REPLACE
INTO TABLE "COUNTRIES"
fields terminated by '/t'
(
LOCATIONCHAR(20),
CNTRY_REFCHAR(20),
CNTRY_ISO_CODECHAR(10),
CNTRY_DESC CHAR(100),
LANG_CODE CHAR(20),
SOURCECHAR(50),
SOURCE_STATUS CHAR(20),
SOURCE_SYSTEMCHAR(20)
)

CONTROL文件2

LOAD DATA
CHARACTERSET 'UTF8'
LENGTH CHARACTER
BADFILE 'sample.bad'
DISCARDFILE 'sample.dsc'
REPLACE
INTO TABLE "COUNTRIES"
fields terminated by '/t'
(
LOCATIONCHAR(20),
CNTRY_REFCHAR(20),
CNTRY_ISO_CODECHAR(10),
CNTRY_DESC CHAR(100),
LANG_CODE CHAR(20),
SOURCECHAR(50),
SOURCE_STATUSCHAR(20),
SOURCE_SYSTEMCHAR(20)
)

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics