仪器信息网APP
选仪器、听讲座、看资讯

【第四届原创】中药指纹图谱相似度分析之TXT文本导入

  • xinmao2011
    2012/02/23
  • 私聊

中药/天然药检测

  • 中药指纹图谱相似度分析之TXT文本导入

    附上药典版《指纹图谱相似度分析》软件,仅供参考学习使用。



    话说很多同行都无法将高效液相气相气质联用跑出来的色谱图导入到指纹图谱相似度分析软件进行分析。目前对谱图相似度分析的软件也只有接下来几个版本:、B版》、药检所版的《中药色谱图分析和数据管理系统》、浙大版的《中药指纹图谱相似度计算软件》及中南版的《相似度分析软件》,在写这边帖子之前,前三个版本我都反复安装试过很多次,第四个一方面需要matlab的只是、另一方我也没有在网上找到资源。最后我选择了使用药典版的《中药色谱指纹图谱相似度评价系统A版》,以下简称(《A系统》)。
    药典版的《中药色谱指纹图谱相似度评价系统》有A,B版两个版本,即:研究版(2004 A)和检验版(2004 B)。研究版主要用于科学研究工作,具有生成对照图谱功能。检验版侧重于色谱指纹图谱的检验工作,功能简化,不具有生成对照图谱的功能。软件就不详细介绍了,直接进入主题——如何将得到的TXT文件转换成能够导入《A系统》的TXT文件。
    本系统支持三种格式文件的导入:AIA(*.cdf)文件,文本文件(*.txt)和Scp(*.Scp)格式文件的导入(如图1)。建议采用通用的AIA(*.cdf)格式文件导入(但是我试过导出的AIA依然无法导入,并且AIA文件没办法编辑,也许是能力不够,至今没有找能编辑AIA文件的方法)。注意AIA(*.cdf)文件中应包含样本图谱的峰面积信息,在色谱工作站导出AIA(*.cdf)文件前应现进行积分。否则导出的AIA(*.cdf)文件可能因不包含峰面积信息而无法导入(我用TXT文件试了,没有积分依然可以导入,只是无法匹配,也就是无法进入下一步相似度分析)。文本文件(*.txt)的导入需要采用特殊的格式,可以参考本系统导出的文本文件格式【文后附上标准文本文件格式】。Scp(*.Scp,即Standard Chromatographic Project的简写)是本系统为生成的对照图谱的导入提供的一种特殊的文件格式。我用的是岛津GC-MS跑出来的质谱图试验的,文后附三个版本的分析软件及需要的文档,其他液相气相的没有使用过,也不知道如何导出TXT或者AIA文件,如有知道的,还希望您不吝赐教)
    第一步,导出text文件,做好准备工作
    打开GCMSSolution软件,导出你需要处理的图谱(如图2),当然如果要导出AIA文件,也可以如图3那样导出。但是只能导出AIA文件,无法导出TXT文件。



    那么如何导出TXT文件呢,莫着急,且看下文
    如图4,右键点击*.qgd,在出现的菜单里点击文件转换,是不是发现原来可以转出很多种格式?ASCII文件转换出来的即为TXT文件,其他四种无需多介绍,包括的信息应该都是一样的。

    点击“ASCII文件转换”,如下图4,点击输出项目,里面有很多选项,当然相似度软件分析的只用两个就可以了,即“定性峰表”和“色谱图(TIC/MIC)”,可以同时选择两项,这样导出到一个TXT文件里;当然也可以分别选择,导出到两个TXT文件里(如图5)。(个人建议导出到两个TXT文件里)

    这样导出的TXT包括了两部分:定性峰表信息(峰序号,保留时间,开始时间,结束时间,Mass,峰面积,峰高,峰面积/峰高等信息)【后文称(积分数据)】和色谱图信息(时间,信号,相对信号三列)【后文称(色谱图数据)】。导出的两个TXT文件,这两部分就分别在一个TXT里,导出的一个TXT文件,那么前面是定性峰表信息,后面是色谱图信息。这样我们需要的TXT文件就导出来了,这样的TXT是无法导入《A系统》的,它会提示提供的信息格式错误。俗话说:万事开头难,那么你也成功了一半了。接下来,就是编辑信息了,使之让《A系统》采纳。
    第二步,编辑text信息,使之为《A系统》采纳
    在进行编辑TXT信息之前,还需要这么一个小小的插曲——做一个Excel来提取你所需要的信息。
    新建一个Excel文件,分别给三个工作表名称改为:色谱图数据,积分数据,我要的数据(如图6)。
    将导出的TXT文件分别打开(我是导出的两个文件,这样选择时可以用Ctrl+A快速选择),将色谱图数据全部复制到Excel中的色谱图数据表,积分数据导入到Excel中的积分数据表。那么,到现在,我们需要的数据也都导入到Excel中去了。接下来就是懒人想出来的办法了。
    进入第三个工资表,也就是“我要的数据”中,编辑公式,提取有用信息。一般同一批色谱图导入到Excel中的积分数据和色谱图数据前面几列都不会改变的,如图7中的方框部分(○1为色谱图数据表,○2为积分数据表)
    有用的数据就是色谱图数据中的时间列(即本例中的第一列)和信号列(即本例中的第二列)及积分数据中的峰序号(即本例中的第一列)、保留时间(即本例中的第二列)、峰高(即本例中的第七列)和峰面积(即本例中的第六列)【一共六列】。那么在“我的数据表”中就提取这些信息即可。如图8

    PS:文后附上例子中的Excel表,熟悉的可以自己编辑,不熟悉的也没关系,看了就能懂。
    好了,小插曲结束,继续正题。
    首先,新建一个TXT文件,用以存储你提取的有用信息。命名好后(TEST1.txt),分别按照标准文本文件格式的信息输入,及先把指纹图谱采样号数据(即色谱图数据)复制粘贴到TEST1.txt文件中,然后再后面复制粘贴上指纹图谱积分数据(即积分数据)。这样就把TXT文本的信息编辑好了,那么接下来应该做什么呢?导入《A系统》试试,对就是这样的。我们导入进去试试,结果奇怪的事情发生了,怎么会多一条直线呢,如图9。

    接下来的就是第三部需要解决的问题,最关键也是最简单的一步
    第三步,删除作怪空格,给图以原貌
    将text1.txt打开,发现有图10的四行中文字,它没有错,错就错在图11,也就是它在作怪。

    是不是发现指纹图谱积分数据那两行都多了很多空格,删除。再导入到《A系统》试试,得到图12的结果
    是不是发现自己很厉害,祝贺你,成功了。就是这样编辑的。但是图12看起来你可能也会觉得很奇怪,后面那么多空白,没关系,图都能够弄出来,还怕这点小问题吗?
    重启《A系统》,重新导入,看看图13.

    恭喜你,可以开始做图谱相似度分析了。

    因已毕业并未从事相关工作,很少上这个网站了,如有疑问,可进QQ群:336852907,Q群有相关资料
    *另外,鄙人才疏学浅,非所有问题都能解决
    请教于人先尊重于人
  • 该帖子已被管理者-设置为精华,下面是奖励记录:加20积分,加5声望
    +关注 私聊
  • gycxycn00

    第1楼2012/02/23

    xinmao2011(xinmao2011) 发表:

    中药指纹图谱相似度分析之TXT文本导入
    话说很多同行都无法将高效液相气相气质联用跑出来的色谱图导入到指纹图谱相似度分析软件进行分析。目前对谱图相似度分析的软件也只有接下来几个版本:、B版》、药检所版的《中药色谱图分析和数据管理系统》、浙大版的《中药指纹图谱相似度计算软件》及中南版的《相似度分析软件》,在写这边帖子之前,前三个版本我都反复安装试过很多次,第四个一方面需要matlab的只是、另一方我也没有在网上找到资源。最后我选择了使用药典版的《中药色谱指纹图谱相似度评价系统A版》,以下简称(《A系统》)。
    药典版的《中药色谱指纹图谱相似度评价系统》有A,B版两个版本,即:研究版(2004 A)和检验版(2004 B)。研究版主要用于科学研究工作,具有生成对照图谱功能。检验版侧重于色谱指纹图谱的检验工作,功能简化,不具有生成对照图谱的功能。软件就不详细介绍了,直接进入主题——如何将得到的TXT文件转换成能够导入《A系统》的TXT文件。
    本系统支持三种格式文件的导入:AIA(*.cdf)文件,文本文件(*.txt)和Scp(*.Scp)格式文件的导入(如图1)。建议采用通用的AIA(*.cdf)格式文件导入(但是我试过导出的AIA依然无法导入,并且AIA文件没办法编辑,也许是能力不够,至今没有找能编辑AIA文件的方法)。注意AIA(*.cdf)文件中应包含样本图谱的峰面积信息,在色谱工作站导出AIA(*.cdf)文件前应现进行积分。否则导出的AIA(*.cdf)文件可能因不包含峰面积信息而无法导入(我用TXT文件试了,没有积分依然可以导入,只是无法匹配,也就是无法进入下一步相似度分析)。文本文件(*.txt)的导入需要采用特殊的格式,可以参考本系统导出的文本文件格式【文后附上标准文本文件格式】。Scp(*.Scp,即Standard Chromatographic Project的简写)是本系统为生成的对照图谱的导入提供的一种特殊的文件格式。我用的是岛津GC-MS跑出来的质谱图试验的,文后附三个版本的分析软件及需要的文档,其他液相气相的没有使用过,也不知道如何导出TXT或者AIA文件,如有知道的,还希望您不吝赐教)
    第一步,导出text文件,做好准备工作
    打开GCMSSolution软件,导出你需要处理的图谱(如图2),当然如果要导出AIA文件,也可以如图3那样导出。但是只能导出AIA文件,无法导出TXT文件。



    那么如何导出TXT文件呢,莫着急,且看下文
    如图4,右键点击*.qgd,在出现的菜单里点击文件转换,是不是发现原来可以转出很多种格式?ASCII文件转换出来的即为TXT文件,其他四种无需多介绍,包括的信息应该都是一样的。

    点击“ASCII文件转换”,如下图4,点击输出项目,里面有很多选项,当然相似度软件分析的只用两个就可以了,即“定性峰表”和“色谱图(TIC/MIC)”,可以同时选择两项,这样导出到一个TXT文件里;当然也可以分别选择,导出到两个TXT文件里(如图5)。(个人建议导出到两个TXT文件里)

    这样导出的TXT包括了两部分:定性峰表信息(峰序号,保留时间,开始时间,结束时间,Mass,峰面积,峰高,峰面积/峰高等信息)【后文称(积分数据)】和色谱图信息(时间[每0.008s记录一次],信号,相对信号三列)【后文称(色谱图数据)】。导出的两个TXT文件,这两部分就分别在一个TXT里,导出的一个TXT文件,那么前面是定性峰表信息,后面是色谱图信息。这样我们需要的TXT文件就导出来了,这样的TXT是无法导入《A系统》的,它会提示提供的信息格式错误。俗话说:万事开头难,那么你也成功了一半了。接下来,就是编辑信息了,使之让《A系统》采纳。
    第二步,编辑text信息,使之为《A系统》采纳
    在进行编辑TXT信息之前,还需要这么一个小小的插曲——做一个Excel来提取你所需要的信息。
    新建一个Excel文件,分别给三个工作表名称改为:色谱图数据,积分数据,我要的数据(如图6)。
    将导出的TXT文件分别打开(我是导出的两个文件,这样选择时可以用Ctrl+A快速选择),将色谱图数据全部复制到Excel中的色谱图数据表,积分数据导入到Excel中的积分数据表。那么,到现在,我们需要的数据也都导入到Excel中去了。接下来就是懒人想出来的办法了。
    进入第三个工资表,也就是“我要的数据”中,编辑公式,提取有用信息。一般同一批色谱图导入到Excel中的积分数据和色谱图数据前面几列都不会改变的,如图7中的方框部分(○1为色谱图数据表,○2为积分数据表)
    有用的数据就是色谱图数据中的时间列(即本例中的第一列)和信号列(即本例中的第二列)及积分数据中的峰序号(即本例中的第一列)、保留时间(即本例中的第二列)、峰高(即本例中的第七列)和峰面积(即本例中的第六列)【一共六列】。那么在“我的数据表”中就提取这些信息即可。如图8

    PS:文后附上例子中的Excel表,熟悉的可以自己编辑,不熟悉的也没关系,看了就能懂。
    好了,小插曲结束,继续正题。
    首先,新建一个TXT文件,用以存储你提取的有用信息。命名好后(TEST1.txt),分别按照标准文本文件格式的信息输入,及先把指纹图谱采样号数据(即色谱图数据)复制粘贴到TEST1.txt文件中,然后再后面复制粘贴上指纹图谱积分数据(即积分数据)。这样就把TXT文本的信息编辑好了,那么接下来应该做什么呢?导入《A系统》试试,对就是这样的。我们导入进去试试,结果奇怪的事情发生了,怎么会多一条直线呢,如图9。

    接下来的就是第三部需要解决的问题,最关键也是最简单的一步
    第三步,删除作怪空格,给图以原貌
    将text1.txt打开,发现有图10的四行中文字,它没有错,错就错在图11,也就是它在作怪。

    是不是发现指纹图谱积分数据那两行都多了很多空格,删除。再导入到《A系统》试试,得到图12的结果
    是不是发现自己很厉害,祝贺你,成功了。就是这样编辑的。但是图12看起来你可能也会觉得很奇怪,后面那么多空白,没关系,图都能够弄出来,还怕这点小问题吗?
    重启《A系统》,重新导入,看看图13.

    恭喜你,可以开始做图谱相似度分析了。

0
    +关注 私聊
  • peace66

    第2楼2012/02/26

    楼主介绍的很详细啊,学习了,辛苦辛苦

0
1
    +关注 私聊
  • 鱼别丢

    第4楼2012/02/26

    我们一般不用Text文本。

0
    +关注 私聊
  • xinmao2011

    第5楼2012/02/27

    是针对不会用其他导入的啊,新手学习的,大侠来看这当然是小菜了,还有,图在附件里

    鱼别丢(micary) 发表:我们一般不用Text文本。

0
    +关注 私聊
  • 鱼别丢

    第6楼2012/02/27

    偶也是菜鸟。。相互交流学习呗!!

    xinmao2011(xinmao2011) 发表:是针对不会用其他导入的啊,新手学习的,大侠来看这当然是小菜了,还有,图在附件里

0
    +关注 私聊
  • 小虾米

    第7楼2012/05/04

    东西很不错 ,研究下

0
0
0
    +关注 私聊
  • flyaway

    第10楼2012/12/25

    请问楼主,现在药典用的中药色谱指纹图谱相似度评价系统还是2004版吗?

0
查看更多
猜你喜欢最新推荐热门推荐更多推荐
举报帖子

执行举报

点赞用户
好友列表
加载中...
正在为您切换请稍后...