分享
 
 
 

2006-5-9 从 文本文件导出数据到 Access 全实录 By Stabx

王朝other·作者佚名  2006-05-20
窄屏简体版  字體: |||超大  

标题: 2006-5-9 从 文本文件导出数据到 Access 全实录 By Stabx

正文:

QUOTE:

主要使用技术为正则表达式.

工具为 (EditPlus 或 Search and Replace) 与 Access 2003.

分为文本操作与数据操作两部分

("[a-zA-Z0-9\-\!]+",")

\n\1

1. 文本操作

2. Access 操作

CODE:

1. 文本操作

要导入的文件是一些 IT 术语文件, 记录确切数不详, 大概有十五万多行, 分为 A-Z 各个文本文件.

一个一个操作文件, 那很麻烦, 我也没耐心.

先把文本文件合并, 打开 CMD 转到当前路径, "copy *.txt glossary.txt",合并文件.

打开文件观察文件规律, 有规律才好办, 没规律可难搞.

文件大致内容:

---/---------------------------------------------------------------------------------

ASPI

{Advanced SCSI Peripheral Interface}

ASPIK

<language, specification> A multiple-style specification

language.

["Algebraic Specifications in an Integrated Software

Development and Verification System", A. Voss, Diss, U

Kaiserslautern, 1985].

(1994-11-30)

Aspirin

<language, tool> A {freeware} language from {MITRE Corp} for

the description of {neural network}s. A compiler, bpmake, is

included. Aspirin is designed for use with the {MIGRAINES}

interface.

{Version: 6.0 (ftp://ftp.cognet.ucla.edu/alexis/)}

(1995-03-08)

ASPLE

<language> A {toy language}.

["A Sampler of Formal Definitions", M. Marcotty et al,

Computing Surveys 8(2):191-276 (Feb 1976)].

(1995-02-08)

---/---------------------------------------------------------------------------------

哦, 很有规律是吧, 那就好办.

我需要的是, 标题, 内容.

格式应该为 "标题","内容 , 公式应该为 "*","

首先应当替换标题, 然后再清除换行符, 再加上术语换行, 文本文件操作为此.

替换标题:

使用 EditPlus , 按CTRL+H

输入正则为: (^[a-zA-Z0-9\-\!]+.*)

替换正则为: "\1","

执行操作

结果:

---/---------------------------------------------------------------------------------

"ASPI","

{Advanced SCSI Peripheral Interface}

"ASPIK","

<language, specification> A multiple-style specification

language.

["Algebraic Specifications in an Integrated Software

Development and Verification System", A. Voss, Diss, U

Kaiserslautern, 1985].

(1994-11-30)

"Aspirin","

<language, tool> A {freeware} language from {MITRE Corp} for

the description of {neural network}s. A compiler, bpmake, is

included. Aspirin is designed for use with the {MIGRAINES}

interface.

{Version: 6.0 (ftp://ftp.cognet.ucla.edu/alexis/)}

(1995-03-08)

"ASPLE","

<language> A {toy language}.

["A Sampler of Formal Definitions", M. Marcotty et al,

Computing Surveys 8(2):191-276 (Feb 1976)].

(1995-02-08)

---/---------------------------------------------------------------------------------

清除换行符, 这主要是为了正确的导入数据到 Access.

输入查找正则: \n

替换内容: <br/>

结果:

---/---------------------------------------------------------------------------------

"ASPI","<br/><br/> {Advanced SCSI Peripheral Interface}<br/><br/>"ASPIK","<br/><br/> <language, specification> A multiple-style specification<br/> language.<br/><br/> ["Algebraic Specifications in an Integrated Software<br/> Development and Verification System", A. Voss, Diss, U<br/> Kaiserslautern, 1985].<br/><br/> (1994-11-30)<br/><br/>"Aspirin","<br/><br/> <language, tool> A {freeware} language from {MITRE Corp} for<br/> the description of {neural network}s. A compiler, bpmake, is<br/> included. Aspirin is designed for use with the {MIGRAINES}<br/> interface.<br/><br/> {Version: 6.0 (ftp://ftp.cognet.ucla.edu/alexis/)}<br/><br/> (1995-03-08)<br/><br/>"ASPLE","<br/><br/> <language> A {toy language}.<br/><br/> ["A Sampler of Formal Definitions", M. Marcotty et al,<br/> Computing Surveys 8(2):191-276 (Feb 1976)].<br/><br/> (1995-02-08)

---/---------------------------------------------------------------------------------

现在应当加上换行符, 每一条数据为一行.

输入查找正则: ("[a-zA-Z0-9\-\!]+",")

替换内容: \n\1

结果:

---/---------------------------------------------------------------------------------

"ASPI","<br/><br/> {Advanced SCSI Peripheral Interface}<br/><br/>

"ASPIK","<br/><br/> <language, specification> A multiple-style specification<br/> language.<br/><br/> ["Algebraic Specifications in an Integrated Software<br/> Development and Verification System", A. Voss, Diss, U<br/> Kaiserslautern, 1985].<br/><br/> (1994-11-30)<br/><br/>

"Aspirin","<br/><br/> <language, tool> A {freeware} language from {MITRE Corp} for<br/> the description of {neural network}s. A compiler, bpmake, is<br/> included. Aspirin is designed for use with the {MIGRAINES}<br/> interface.<br/><br/> {Version: 6.0 (ftp://ftp.cognet.ucla.edu/alexis/)}<br/><br/> (1995-03-08)<br/><br/>

"ASPLE","<br/><br/> <language> A {toy language}.<br/><br/> ["A Sampler of Formal Definitions", M. Marcotty et al,<br/> Computing Surveys 8(2):191-276 (Feb 1976)].<br/><br/> (1995-02-08)

---/---------------------------------------------------------------------------------

这样就完成了文本操作, 现在差的是导入到 Access 中去.

当然, 这几条数据是很容易很不需要时间就替换好了, 不过十多万行的替换操作有够呛.

且 EditPlus 也不怎么完善, 数据过多, 就无法逐个替换, 只好多执行几次.

事实上我使用 EditPlus 根本无法完成我要的操作, 改成 Search and Replace 后轻松完成.

---/---------------------------------------------------------------------------------

Search and Replace 操作以上操作

1. 替换标题

搜索: ^[a-zA-Z0-9\.\-\!]+

替换: "%1%2%3","

2. 清除换行符

搜索: \n

替换: <br/>

3. 每条目加上一个换行符

搜索: <br/>"[a-zA-Z0-9\.\-\!]+","<br/>

替换: <br/>\n"%1%2%3","<br/>

最终用 Search And Replace 处理完后是 12739 行

篇数为 7640篇, 真不少, 七千多条术语.

---/---------------------------------------------------------------------------------

2. Access 操作

打开数据库, 空白处右击, 点导入, 选择有 *.txt 项的选项.

如没有编码方面的问题, 一切默认.

导入完成后我打开 Glossary数据库表 一看, 有29 个字段, 呵呵, 不过除了 字段1 字段2 之外, 其余全是 Null.

删除不必要的字段就剩下了 ID 字段1 字段2 三个字段, 这就是我要的.

''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''

'

' subject : 2006-5-9 从 文本文件导出数据到 Access 全实录 By Stabx

'

' writer : Stabx<shawl.qiu@gmail.com>

'

' blog : http://blog.csdn.net/btbtd \ http://btbtd.exblog.jp/

'

' blog/site : Phoenix.GI - P.GI / \ 绿色学院 - Green Institute

'

' date : 2006-5-10

'

''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''

 
 
 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
2023年上半年GDP全球前十五强
 百态   2023-10-24
美众议院议长启动对拜登的弹劾调查
 百态   2023-09-13
上海、济南、武汉等多地出现不明坠落物
 探索   2023-09-06
印度或要将国名改为“巴拉特”
 百态   2023-09-06
男子为女友送行,买票不登机被捕
 百态   2023-08-20
手机地震预警功能怎么开?
 干货   2023-08-06
女子4年卖2套房花700多万做美容:不但没变美脸,面部还出现变形
 百态   2023-08-04
住户一楼被水淹 还冲来8头猪
 百态   2023-07-31
女子体内爬出大量瓜子状活虫
 百态   2023-07-25
地球连续35年收到神秘规律性信号,网友:不要回答!
 探索   2023-07-21
全球镓价格本周大涨27%
 探索   2023-07-09
钱都流向了那些不缺钱的人,苦都留给了能吃苦的人
 探索   2023-07-02
倩女手游刀客魅者强控制(强混乱强眩晕强睡眠)和对应控制抗性的关系
 百态   2020-08-20
美国5月9日最新疫情:美国确诊人数突破131万
 百态   2020-05-09
荷兰政府宣布将集体辞职
 干货   2020-04-30
倩女幽魂手游师徒任务情义春秋猜成语答案逍遥观:鹏程万里
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案神机营:射石饮羽
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案昆仑山:拔刀相助
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案天工阁:鬼斧神工
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案丝路古道:单枪匹马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:与虎谋皮
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:李代桃僵
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:指鹿为马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:小鸟依人
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:千金买邻
 干货   2019-11-12
 
推荐阅读
 
 
 
>>返回首頁<<
 
靜靜地坐在廢墟上,四周的荒凉一望無際,忽然覺得,淒涼也很美
© 2005- 王朝網路 版權所有