存档

‘Biology’ 分类的存档

[原创]谈谈用基因组DNA来解释生物性状是否会犯还原论的错误(以偏概全)

2009年12月31日 Galaxy 没有评论

今晚,同事工作之余问我,把生物的一切都用DNA来解释是否是还原论,后来说就是是否能用DNA来解释一切生物现象。嗯,所谓的今晚,是20091230晚上,时间是23点多。我次日临晨才有空写。
话说,按日本说法,现在是26点半,还不到。

上午刚听Francois Taddei讲他关于寿命的研究,说同一细菌的后代,在寿命上有很大差异,有时差异是在后2代才表现出来(画系谱可以看到)。Galaxy听了一半就被叫去开会,虽然是昨天就知道有个时间未定的小会……

那么,DNA能解决什么?

就算是甲基化,也是有序列特异性的,(就是说)DNA间接决定了甲基化。
……
就像统计(中那样),对特定的DNA,总体期望是可以由DNA确定的,你从这个总体中取一个个体,个体的值是随机的,(差异就在环境等随机因素,)只有多次取样(平均值)才接近总体期望。

书面写的总和口头说的感觉不同,看来二次元和三次元的区别还是客观存在地……

他回忆了上午那PPT中的:

表现型=F(基因, 环境)

阅读全文…

分类: Biology 标签: ,

GC含量作图的工具

2009年6月15日 Galaxy 没有评论

有人来问,就g了下,然后就有了本文。


there are several online tools allowing you to do a GC plot as well as CpG plot:

http://www.ebi.ac.uk/emboss/cpgplot/
http://www.urogene.org/methprimer/index1.html

阅读全文…

分类: other Biology 标签: ,

[Note]五款对接软件比较中还是GLIDE比较好

2008年10月4日 Galaxy 2 条评论

http://stat3.blog.sohu.com/81746595.html
GLIDE-蛋白质的预处理(protein preparation)
1.Maestro鼠标基本操作
右键拖放–平动分子
按住滑轮拖放–旋转分子
左键–选择键
右键+滑轮拖放–分子视图放大与缩小
2.一步一步对要对接的蛋白进行处理
1). 输入一个蛋白/配体分子复合物的结构,一般是PDB格式的。这一步需要的是一个蛋白/配体分子的复合物(DOCK6.1中也需要一个参考小分子的)。
2). 保留一些必要的水分子,去掉一些不必要的水分子。一般情况下是把所有的水分子都给去掉的,但是有些水分子对配体与受体蛋白之间的连接有一个桥梁作用,还是要留下来的,这些保留下来的水分子能正确定向也是很重要的。蛋白预处理的过程中,氧原子会自动给加上氢的。
3). 对多聚复合体的简化。如果这个蛋白/配体复合物是二聚体或者多聚体,一般会有一些重复的结合活性位点,当然还有多余的重复蛋白链也是多余的。所以对这些重复的以及多余的要删掉。
4).调整蛋白,金属离子,辅因子。对于蛋白最常见的错误就是残基不完整,要是这些错误出现在离活性位点较远的地方,一般影响不大。要是出现在活性位点附近,还是要修正一下的。对于金属和蛋白之间的键一般要去掉的,并加上有效电荷。如果有需要要将辅因子的键级和有效电荷加以调整。
5). 如果有俩配体存在俩活性区域,那么这俩配体的键级都要进行修正。
6). 运行蛋白的预处理。打开”Protein Preparation”面板,鼠标选取配体,选择合适的设置,点击”Start”. “Protein Preparation Start”对话框打开。在”Name”文本框里敲入一个文件名(自己设置)。
7). 重新检查处理的结果。


http://stat3.blog.sohu.com/75963485.html
五款对接软件比较中,还是GLIDE比较好,正在体验中。

由于D版的Surflex出现问题,所以无法体验比较可惜,只好用一下GLIDE,不过感觉挺好的,速度很快。

Program | Number of results
| High- Medium- Inaccurate
| accuracy accuracy
—————————————
Glide | 39 24 5
GOLD | 47 13 8
LigandFit| 24 35 10
FlexX | 26 18 25
DOCK | 4 19 45

Maestro7.5的安装:

Install the suite, for example in /home/username/schrodinger
(so for the rest of the instructions, = /home/username/schrodinger)

Copy ‘license’, ‘flexlmstart.sh’ and ‘flexlmstop.sh’ to and overwrite (make sure flexlmstart.sh and flexlmstop.sh have executable permission)

Copy ‘SHROD’ to /mmshare-v15113/bin/Linux-x86 and overwrite (make sure SHROD has executable permission)

Edit your startup shell script (here for example it’s .cshrc) and add the following environment variables (the format might be different depending on the shell; .bashrc, .cshrc, .login, .shrc, .tcshrc, .zshrc, etc.):

setenv SCHRODINGER
set path = ($path )

Close/Restart the shell, or source .cshrc

Verify that the variables are properly set by typing the following commands:
echo $SCHRODINGER
echo $path

Run flexlmstart.sh

Start the main application with: maestro

Note: maestro will not run if it’s launched from /mmshare-v15113/bin/Linux-x86 so make sure you launch it from a different dir.

Enjoy!

P.S. We included flexlmstart.sh to simplify the FLEXlm License Server startup. You only need to run it once after a computer reboot.
Run flexlmstop.sh if you wish to shutdown the server.

To run the license server manually, type: licadmin SERVERUP
To shutdown the license server manually, type: licadmin SERVERDOWN -q -vendor SCHROD
安装及使用方法:
1.将下载好的[医药软件].TLF-SOFT-Schrodinger.Suite.2007.iso.TBE.bin文件载入虚拟光驱。如无法载入虚拟光驱,建议使用UltralISO将其转换成iso格式文件,再载入虚拟光驱。把schroedinger-suite 2007安装到任意盘的根目录下
2.将软件包中crack目录下的license_server.dat 复制到软件安装目录下的\mmshare-v16109\bin\WIN32-x86\下,再在该目录下将license_server.dat复制一份命名为license.dat,然后在该目录下新建文件cmd.txt,输入cmd.exe /k lmgrd -z -c license.dat后保存文件,把文件名改为cmd.bat,发送快捷方式到桌面上
3.打开控制面板的系统项,在高级选项卡里点开环境变量,新建系统变量SCHROD_LICENSE_FILE值为@localhost
4.复制软件包中crack目录下的schroedinger_2007_patcher.exe到软件的安装目录并执行
安装过程完成,运行时先双击执行发送到桌面上的cmd.bat(可改成其它名称)不要关闭它,然后运行桌面上的Maestro-v8.0,OK!
有问题欢迎联系
以上是2007版在windows下的安装,在这种情况下装Xfree86, 原来机子里必须是没有装过cygwin的,否则xfree可能会出现问题!!!

分类: Biology 标签: ,

[Note]DOCK的安装+教程

2008年10月4日 Galaxy 3 条评论

http://stat3.blog.sohu.com/73765838.html
2007-12-17 | DOCK6.1的安装
其实DOCK的主页已经给出了DOCK6.1的安装,由于自己不清楚其中的选择,所以一直没有安装上。DOCK主页上有http://blur.compbio.ucsf.edu/pipermail/dock-fans/ 这么一个网址,里面有很多人会提到自己在安装或者使用dock时候遇到的问题,均有解答,有人就问怎么step by step 教安装DOCK。
[user@dock ~] tar -zxvf dock.6.1.tar.gz
[user@dock ~] cd dock6/install
[user@dock ~] ./configure gnu #有人知道linux,却不一定知道gnu,其实仅仅一个linux内核是不能满足用户的需求的,很多软件要依靠gnu,ls命令就是gnu下的
[user@dock ~] make all # builds all the DOCK programs
[user@dock ~] make dock # builds only the dock program
[user@dock ~] make utils # builds only the accessory programs
[user@dock ~] cd test
[user@dock ~] make clean
[user@dock ~] make test
[user@dock ~] make check

可以去试一下啊,enjoy it!
网上看到很多教程,或者叫使用指南,晕,咬文嚼字的。。。我的理想(http://fralium.spaces.live.com/default.aspx)给出了一些使用,后来觉得很像踏雪寻香的师弟,好像就是哦,转载了一下他写的东西,比较实用。
这里写一下大型数据库的筛选的过程,由于分子数在50万以上,因此你一般要至少要符合两个条件,

1,有至少32个cpu的cluster,保证每天的筛选量至少在3万,那就是说一个月可以筛完,当然cpu越多越好,如果谁有bule gene的帐号提供,可以和我联系。谢谢
2,要支持并联计算的对接软件,我觉得价格又好量又足的非UCSF的DOCK莫属了。最新版本为DOCK6.0,可以去申请,反正学术版本是免费的。

现在开始将将如何使用。大致过程。

首先你要有研究体系蛋白质或者其他结构的PDB文件,美国布鲁克海文国家实验室提供,如果没有pdb,那么估计你就需要同源模键了,那玩意。。。没有好的模版,可信度是需要怀疑的,这就看你的本事了。

1,对这个pdb文件进行处理,一般要去除水分子,其他小分子,带电金属离子,配体小分子等,最好看看有没有其他需要修改的,用UltraEdit打开 pdb文件,看看有没有残基编号为数字后跟了A之类的,这表明这个位置可能有两种可能结构,把这些都删除了,不需要。然后就是CYS和CYX,主要看这个残基间存不存在二硫键。然后还有就是HIS,在AMBER中一般使用HID,HIE,HIP,主要是看两个氮原子的不同质子化状态。(http://amber.ch.ic.ac.uk/archive/200210/0238.html 这里有一个比较详细的说明)。然后保存成一个比如说receptor.pdb(推荐用SYBYL7+UltraEdit32来完成这个工作),保证这个文件中只含有受体大分子。

2,这个文件在后面是要用来计算表面的。然后对这个文件再进行处理,修复末端残基,加氢,加电荷,这还不算完,还要对加的氢进行结构优化,但我们可以只优化氢这部分,然后保存,这些工作都可以用SYBYL7来完成。(说实话,我觉得SYBYL比INSIGHTII好操作),这个结构要保存成 receptor.mol2。DOCK软件只识别mol2格式的文件,这种格式包含更多信息。貌似TRIPOS公司的版权格式。

3,小分子文件的准备也差不多,修改原子类型等,加氢,加电荷,可以优化,不过如果筛选数据库的话,手工处理数据时不太现实的,推荐用ZINC,都处理好了,不用自己在重复一般。哈哈!关键是免费,一共有400多万个分子阿!商业的都没有这么多!
对了,记得要把原pdb文件中的配体分子取出来,也这么操作一下,保存为ligand.mol2,这个在后面是确定活性位点用的。叫做参考分子。

准备好受体和配体后,就该进入正式对接流程了。

1,准备蛋白质分子的表面文件,这里推荐使用dms程序,很方便,也是免费的。安装还是比较容易的,不过当初我硬是折腾了很久。真笨。
命令格式: dms input_file [-a -d density -g file -i file -n -w radius -v] -o file
-a use all atoms, not just amino acids
-d change density of points
-g send messages to file
-i calculate only surface for specified atoms
-n calculate normals for surface points
-w change probe radius
-v verbose
-o specify output file name (required)
一般可以按照这个格式:dms receptor.pdb -a -n -w 1.4 -o receptor.ms

2,现在就是要利用上面的球面来选择对接说需要使用的那些spheres,Dock程序自带有sphgen程序。计算过程原理我就不写了。不过计算需要一个输入文件,即INSPH。格式一般是固定的。如下
receptro.ms #就是上面dms生成的。
R #sphere outside of surface (R) or inside surface (L)
X #specifies subset of surface points to be used (X=all points)
0.0 #prevents generation of large spheres with close surface contacts (default=0.0)
4.0 #maximum sphere radius in Angstroms (default=4.0)
1.4 #minimum sphere radius in Angstroms (default=radius of probe)
receptor.sph #clustered spheres file
其中各项一般使用默认值,具体参考Dock提供的文档。
用vi编辑,然后保存,运行时只要输入sphgen即可,保证当前目录下面有上面这个输入文件即可。不过出错,要把生成的中间文件删除,不然下次计算时程序会认为计算完成,报错。

3,然后就是选择我们需要的spheres,一般是pdb源文件中的ligand的周围6-10a范围的球。具体自己参考自己分子的大小选择。这一步其实是告诉dock程序我们需要的活性位点的位置。

格式很简单 sphere_selector receptor.sph ligand.mol2 6.0

4,这一步可以不做,有时候。就是用showspere程序显示我们选择的代表活性位点的球的具体情况,会生成pdb格式的一个文件,可以用vmd等打开,showspere的运行灵活,可以是问答式,也可以使用一个配置文件以,一般最好写成配置文件,方便以后修改。

运行很简单 showspere < showsphere.in
showsphere。in 文件格式如下:
rec.sph #sphere cluster file
1 #cluster number to process (<0 = all) 一般我们选择的族都是第一族。
N #generate surface as well as pdb file
selected_cluster.pdb #name for output file

5,现在我们要为对接划定一个区域了,就是说计算这个区域内的相互作用,如果整个蛋白质都计算不仅耗时,其实也没必要,对接嘛,又不是动力学。showbox和showspher一样,可以问答式,也可以用配置文件,一般用配置文件方式。
showbox < box.in
具体box.in文件格式为
Y
5
receptor.sph
1
rec_box.pdb

运行后我们会得到一个rec_box.pdb文件,即为小分子与靶蛋白进行对接的区域。

6,现在开始正式对接了,不过为了减少正式对接的计算量,dock会先进行grid计算,就是把对接区域预先分成很小很小的立体格,然后先计算好一些量。具体可以参考技术文档。
命令格式很简单 grid -i grid.in
如果初次运行,即没有写好的grid.in,那就直接运行grid,然后进入问答式,会问你参数设置,你按需填就是了。我就偷懒不写了,因为大家的设置都不一样,而且涉及版本,DOCK5和DOCK6貌似不一样。
7,哈哈,开始对接,对接命令dock6,命令格式类似grid,也是有in输入文件,没有就进入问答式,版本不同参数也不同。不过需要说明的是如果你是筛选数据库,那么你还是不要设置优化小分子这个选项,不然你会痛苦的想自杀的。除非你家里有银河,或者曙光,呵呵,blue gene也行。
dock6 -i dock.in -o dock.out
dock.in 是输入文件
dock.out 是输出文件。
当然说明一下,如果筛选数据库,就要涉及并联,dock里面只有dock6这个对接程序是支持并联计算的,就是说你其他的东西都是在单机下面计算的,好在出了grid计算量稍大,其他都很快了。
并联一般格式 nohup mpirun -np 64 dock6 -i dock.in -o dock.out &
说明一下,大家用并联一般都是远程登录,所以安全起见还是nohup,我和师兄都吃过没加这个的亏。当你算了很久很久很久后,突然断掉。。。。
然后就是mpirun这个最好是当初用来编译dock6.mpi的那个,下次我会写关于如何编译的。这里是用64个cpy来计算,一般一天能计算6-7万个分子,具体看分子大小,如果都是大分子,估计3万左右吧。
——-已经注明转载出处,本人也不应用于商业价值,与之分享—–

分类: Biology 标签:

解码 XML 和 DTD

2008年7月16日 Galaxy 1 条评论

www-128.ibm.com/developerworks/cn/xml/x-dtdint/

解码 XML 和 DTD

编写格式正确和定义明确的 XML 的初学者指南

2001 年 7 月 01 日

这篇介绍性文章说明了如何创建 XML“文档类型定义(DTD)”和格式正确定义明确的 XML 文件,这些文件能够由您选择的 XML 语法分析器进行确认。虽然不必在产生的每个 XML 文件中都包含 DTD,但这样做将会使您的生活大为轻松。DTD 不仅强制使用为 XML 文件建立的语法,它还将允许文件由确认 XML 语法分析器进行语法分析。代码样本包括 DTD 和 XML 文档示例。

“可扩展标记语言”已经存在了十分长的一段时间,因此现在大多数人都熟悉其最基本的需求:所有
XML 文档都必须既格式正确又有效。但如何确定您的 XML
文档是否满足这些需求呢?简短的回答就是您不用确定。或者至少是不必。大多数时候,您会依赖于
XML 语法分析器来为您管理这些苦活。

在经过一些小调查(请参阅
参考资料)后您就会发现市场上到处充斥着 XML
语法分析器,其中大多数都可以从 Web 上免费获得。一个基本的 XML
语法分析器既强调 XML
语法规则(即,确保文件格式正确),又建立文件的有效性。XML
语法分析器可用于几乎每种相关的计算机语言,包括
C、C++、Perl、Python、Tcl 和 Java。

谈到确保 XML
格式正确时,您可以或多或少地指向一个语法分析器然后执行。然而为了确保文档有效,需要为语法分析器提供文档类型定义或
DTD。

模式如何?

最近,W3C 将长期以来一直讨论的 XML Schema
规范推进成“建议书”状态,这意味着它有可能为开发人员普遍所用。在某些方面,XML
Schema 将替代 DTD。而在其它方面,DTD 仍是最好的解决方案。有关解释
XML Schema,以及将它与 DTD 进行功能和处理上的对比的 developerWorks
文章,请参阅

参考资料

本文回顾了 XML
文档格式正确究竟意味着什么,然后会谈到较少讨论的话题确认 -
更具体地说,是 DTD。我将讨论为什么您需要将 DTD 包含在 XML
文件中、介绍一些最常用的 DTD
语法,并使用几个简单的样本来教您开始编写自己的 DTD。

为什么要格式正确?

当 XML 开发人员谈到格式正确和格式不正确的 XML
时,我们并不是参加美学讨论。当然,格式正确的 XML
文档是满足以下三个基本结构需求的文档:

  • 有一个包含所有其它元素的父(或根)元素
  • 每个开始标记都有结束标记
  • 所有元素都正确嵌套的

清单 1 是一个格式正确的 XML 示例。请注意:该文档的父元素是

<person> ,每个开始标记都有一个结束标记,并且每个结束标记都有与其开始标记完全相同的定义。通常,开始标记和结束标记之间包括的是信息或文本。不过,在某些情况下,标记之间没有包括信息或文本。空标记必须用一个右斜杠来结束。

<nothing/> 就是一个空标记。

清单 1. 格式正确的 XML

<person>
    <firstname>Jane</firstname>
    <lastname>Fung</lastname>

    <nothing/>
</person>

清单 2 是一个格式不正确的 XML
示例。它举例说明了三种常见错误。首先,开始和结束

<firstname>
标记没有完全匹配。其次,

<lastname>
标记没有结束标记。最后,空标记没有用一个右斜杠结束。

清单 2. 格式不正确的
XML

<person>
    <Firstname>Jane</firstname>
    <lastname>Fung
    <nothing>
</person>


回页首

DTD
中有什么内容?

XML
的优点在于它允许您定义自己的有意义的标记,因此您可以最大程度地定制文档。但
XML 就是
XML(可扩展),而人就是人(疯狂的人),这可能很快就会无法控制。解决方案是
DTD,它指定了 XML 文档的标记。简而言之,DTD
指定:可以在文档中存在的元素、那些元素可以具有的属性、在元素内部元素的层次结构以及元素在整个文档中出现的顺序。

虽然 DTD 不是必需的,但它们确实带来方便。DTD
适合三个基本用途。它能:

  • 对标记编制文档
  • 加强标记参数内部的一致性
  • 使 XML 语法分析器能够确认文档

如果不对 XML 文档进行 DTD 定义,文档就无法由 XML
语法分析器进行确认。使用 XML Schema 实例来代替 DTD
如何?(请参阅侧栏

模式如何?)清单 3 是清单 1
中显示的 XML 文档的 DTD。

清单 3. 精简 person.xml 的
DTD

<!ELEMENT person (firstname, lastname)>
<!ELEMENT firstname (#PCDATA)>
<!ELEMENT lastname (#PCDATA)>

<!ELEMENT nothing EMPTY>

关于示例的几点说明

清单 3 中 DTD 的第一行定义了 XML
文档的父元素:

person 。person
元素有两个子元素:

firstname

lastname

第二和第三行包含了元素属性

#PCDATA ,它表明

firstname

lastname
元素可能包含经过语法分析的字符数据(在这种情况下是文本)。DTD
文件的最后一行描述了一个空标记:

nothing

从清单 3 中的 DTD 可以看出,任何阅读我们的 XML
文档的人(以及对它进行语法分析的语法分析器)都知道

person 元素仅包含两个文本元素:

firstname

lastname 。此外,DTD
规定,在整个文档中,

firstname 元素必须在

lastname 元素之前出现。

在转到更复杂的示例之前,让我们回顾一下一些最常用的 DTD
语法元素。可以在 W3C 主页上找到完整的 DTD 规范(请参阅

参考资料)。



回页首

DTD
语法快速指南

A、B、C 和 D 是在下例中代表元素的变量。

元素必须有正好一个

A 、至少一个

B (由加号表示)、零个或多个

C (由星号表示)以及零个或一个

D (由问号表示):

<!ELEMENT element (A, B+, C*, D?)>

元素可能有

A

B

C
之一:

<!ELEMENT element (A | B | C)>

元素不包含任何内容:

<!ELEMENT element EMPTY>

元素可以包含在 DTD 中列出的任何元素:

<!ELEMENT element ANY>

元素可能包含经过语法分析的字符数据或另一个元素(

element2 )。星号(*)表示混合内容模型 — 其中元素可以包含不同类型的属性。

<!ELEMENT element (#PCDATA|element2)*>

下例将文本 “entity reference” 插到文档中它出现的任何地方:

<!ENTITY element "entity reference">

可以看到在 XML 文档中该实体引用元素如下:

&element;

下例表明其元素是一个包含三个属性的空标记:属性
1(

att1 )是一个可选属性,属性
2(

att2 )是带有固定值

"A" 的属性,属性
3(

att3 )是必需的文本属性。

   <!ELEMENT element EMPTY>

        <!ATTLIST element
     att1 ID #IMPLIED
     att2 CDATA #FIXED "A"
     att3 CDATA #REQUIRED>

可以看到在 XML 文档中使用的这个元素如下:

<element att2="A" att3="MustHave"/>

属性

CDATA

表示包括的信息应该是文本。

ID
属性表明必须填入唯一的标识。每个元素只能有一个

ID
属性。另外,

CDATA 表示

att2

att3 可能包含任何字符串。

如果您对该语法还未完全熟悉,请继续阅读。下一部分中的工作示例应该能帮助您消除疑虑。



回页首

工作示例

可以使用 Microsoft Internet Explorer 5 或更高版本查看清单 4
中显示的 XML 文档 ― 前面示例中使用的 people.xml
文件的扩展版本。如果在 IE5 中打开
people.xml,应该看到一个树结构。这是因为 IE5 带有能够将 XML
文档语法分析成元素树的 XML 语法分析器。

还可以在

参考资料中找到这个文件及其
DTD。

清单 4. people.xml
的完整清单

<?xml version="1.0"?>
<!DOCTYPE people SYSTEM "people.dtd">
<people>
    <person>
        <name>
            <firstname>Jane</firstname>

            <lastname>Fung</lastname>
        </name>
        <look>good-looking</look>
        <possession>
            <car>

                <model>Civic</model>
            </car>
            <job>&IBM;</job>
        </possession>
    </person>

    <person>
        <name>
            <firstname>G.I.</firstname>
            <lastname>Jane</lastname>
        </name>

        <look>tough</look>
        <possession>
            <house country="CANADA" city="Toronto">
                <townhouse townhouse_type="good" />
            </house>

            <bankaccount bankaccount_number="sg-123">
    <![CDATA[<greeting>5000</greeting>]]>
            </bankaccount>
        </possession>
        <other>

            <car>she has a car</car>
            <house country="CANADA" city="Toronto">
                <townhouse townhouse_type="good" />
            </house>
        </other>

    </person>
</people>

关于 XML 的几点说明

对 XML 的深入探讨主要考虑的是文档头中的几个元素,从以下开始:

<?xml version="1.0"?>

每个 XML 文档都必须包含这样的一个头,向 XML
语法分析器表示它是一个 XML 文档。头中的下一行告诉 XML
语法分析器该文档是使用什么字符编码来创建的:

<!DOCTYPE people SYSTEM "people.dtd">

在 Unix 系统上创建的 XML 文档和在 Windows 系统上创建的 XML
文档可能有不同的编码。

还可以为第一行设置可选的

standalone
属性。standalone 的缺省值是

no

no 值表示该 DTD
定义是在另一个文件中描述的。

yes 值表明该 DTD 应该在 XML
文档内部定义。我没有为示例设置这个属性;如果想设置,它应该看起来如下:

   <?xml version="1.0" standalone='yes'?>
     <!DOCTYPE people [
     <!ELEMENT people (person+)>
     <!ELEMENT person (#PCDATA)>
     ]>

还应该注意使这个文档格式正确的方法。例如,所有空标记都用一个右斜杠结束,如下所示:

<townhouse townhouse_type="good" />

还请注意

CDATA 用于对所有若不进行转义就会以 XML 语言解释的任何数据进行转义,例如:

<![CDATA[<greeting>5000</greeting>]]>

如果适当的格式化,这一行将以文本内容显示:

<greeting> 5000 </greeting>

可以从 XML 文件的进一步研究中获益,甚至可能从对您自己的文件运行
XML 语法分析器获益(请参阅

参考资料)。但是现在,让我们看一下 people.xml
文件的 DTD。

清单 5. people.dtd
的完整清单

<!ELEMENT people (person+)>
<!ELEMENT person (name, look*, possession?, other?)>
<!ELEMENT name (firstname, lastname)>
<!ELEMENT firstname (#PCDATA)>
<!ELEMENT lastname (#PCDATA)>
<!ELEMENT look (#PCDATA)>
<!ELEMENT possession (car?, house?, bankaccount?, job?)>

<!ELEMENT car (#PCDATA|model)*>
<!ELEMENT model (#PCDATA)>
<!ELEMENT house (apartment|standalone|townhouse)>
<!ATTLIST house house_area ID #IMPLIED country CDATA #FIXED
"CANADA" city CDATA #IMPLIED>
<!ELEMENT apartment EMPTY>
<!ELEMENT standalone EMPTY>
<!ELEMENT townhouse EMPTY>
<!ATTLIST townhouse townhouse_type ID #IMPLIED>
<!ELEMENT bankaccount (#PCDATA)>

<!ATTLIST bankaccount bankaccount_number ID #REQUIRED>
<!ELEMENT job (#PCDATA)>
<!ELEMENT other ANY>
<!ENTITY IBM "Proud to work for IBM">

关于 DTD 的几点说明

使用

快速指南作为参考,通过比较 XML 文件及其
DTD,您应该能够方便地定义 DTD 和 XML
文件中各元素之间的关系。不过,还有两个剩下的元素,您可能感兴趣。

清单 4 包含了对实体的引用。

<job>&IBM;</job>

实体引用用于代替在 DTD
文档中定义的特定字符或字符串。进行了语法分析后,该实体引用将读作:

<job> Proud to work for IBM </job>

还应该注意,

<other> 标记的内容类型是

ANY 。这表示

<other>
可能包含所有以前已在 DTD 中声明过的元素。因此,

other
元素可能包含

car

house

元素,如下:

   <other>
         <car>she has a car</car>
         <house country="CANADA" city="Toronto">
             <townhouse townhouse_type="good" />

         </house>
     </other>


回页首

结束语

这就结束了对创建格式和定义均正确的 XML
文件的基本介绍。您可能想要继续自己研究 people.xml 和 people.dtd
文件。如果想要尝试使用 XML
语法分析器对这些文件进行语法分析,请参阅“参考资料”来查找可供下载的语法分析器的列表。

参考资料

  • 如果希望了解有关 XML 和 DTD 语法的更多信息,

    XML
    1.0 W3C Recommendation
    应该是您的第一站。

  • Tim Bray 是 XML 1.0 规范的原始编辑之一。他维护着

    Textuality.com,可以在上面找到他关于
    XML、DTD 等内容思想。还可以找到 Lark 和 Larval,Bray 自己的 XML
    语法分析器。

  • Doug Tidwell 的


    教程:XML 简介
    展示了对“可扩展标记语言”近乎完整的探讨。

  • 您可能还想要仔细查看 Mark Johnson 在 JavaWorld 上发表的


    XML for the absolute beginner
    一文。

  • 请下载本文示例中使用的

    people.xml

    people.dtd文件,以进一步研究和分析。

XML 语法分析器:简表

  • IBM 的


    XML Parser for Java
    (XML4J),目前是版本 3.1.1,是以 100% 纯
    Java 编写的确认 XML 语法分析器。包(com.ibm.xml.parser)包含了对
    XML 文档进行语法分析、生成、操纵和确认的类和方法。

  • IBM 的


    XML for C++ parser
    (XML4C) 基于 Apache 的 Xerces-C XML
    语法分析器,它是用 C++ 的可移植子集编写的确认 XML 语法分析器。

  • TclXML

    是全 Tcl 的 XML 语法分析器。

  • Xerces 是来自
    Apache Software Foundation 的 Java 语法分析器,目前是版本
    1.4.0。

  • Lars Marius Goshol 负责维护作为公众服务的这个详尽的


    XML 语法分析器列表
    和其它 XML 工具。

相关链接

  • XML
    专区页面
    上查看最新信息。

  • 如同 DTD,在创建 XML
    文件时,样式表不是必需的,但如果希望控制浏览器中文档显示,它们就非常重要。Alan
    Knox 的 developerWorks 文章,

    Style sheets can
    write style sheets, too
    ,向您介绍如何使用 XSL 来将 XML
    数据转换成用于浏览器的复杂显示标记。

  • 阅读完上述文章后,可能想要查看 IBM alphaWorks 的

    XSL Editor

  • 如果希望探索 XML Schema 以及它与 DTD 的关系,请参阅 David Mertz
    在其 developerWorks 专栏“XML 问题 7”中的

    DTD 和 XML
    Schema 比较
    ,以及 Kevin Williams 的 developerWorks 临时讲台


    赞同使用 XMLSchema 的文章
    来了解用于数据的 XML
    文档的结构化定义。有关使用 XML Schema
    会怎样的简短说明,请参阅介绍性文章


    Basics of using XML Schema to define elements

关于作者

author

Jane Fung 目前在 IBM VisualAge for Java
技术支持小组工作,该小组为使用 VisualAge for Java
的企业开发人员提供支持。Jane
获得了加拿大安大略省的沃特卢大学电子工程应用科学学士学位,并且是一名
Sun Java 2 认证程序员。可以通过
jcyfung@ca.ibm.com 与 Jane
联系。

分类: DateBase, Programming 标签: , ,

TRANSFAC

2008年3月9日 Galaxy 3 条评论

TRANSFAC® Release 7.0 – Documentation

TRANSFAC tables and their relations

The present release comprises the following ASCII flat files or tables:

SITE 7915 entries
GENE 2397 entries (1504 entries with SITE links)
FACTOR 6133 entries
CELL 1307 entries
CLASS 50 entries
MATRIX 398 entries

The contents of each table will be detailed below.

SITE gives information on (regulatory) transcription factor binding sites within eukaryotic genes. GENE gives a short explanation of the gene where a site (or group of sites) belongs to. FACTOR describes the proteins binding to these sites. CELL gives brief information about the cellular source of proteins that have been shown to interact with the sites. CLASS contains some background information about the transcription factor classes, while the MATRIX table gives nucleotide distribution matrices for the binding sites of transcription factors.

The ASCII flat file table SITE comprises all information which in the relational model is contained in distinct but connected records (SEQUENCES, METHOD, ENTRY and REFERENCE). Similarly, FACTOR, CLASS and MATRIX contain the full reference data. However, the factors binding to a certain site are indicated within the SITE entry by name and factor accession number, and vice versa the sites a certain factor binds to are likewise listed in the FACTOR records.

http://www.gene-regulation.com/pub/databases/transfac/doc/relations.html

分类: DateBase 标签: ,

农达®(Roundup®)+

2008年2月15日 Galaxy 1 条评论

导  言 

农达®(Roundup®)41%水剂,是美国孟山都公司最新研制并全球性开发的一种非选择性、无残留的苗后除草剂,通过植物叶片和非木质化的茎杆吸收、传导到植物全株各部位,对多年生宿根性杂草,以及各种一年生和越年生的禾本科、莎草科和阔叶杂草、小灌木等,都有优异的防除效果。

农达®作为一种灭生性、内吸传导型的茎叶处理除草剂,可以在农作物播种或移栽之前,直接喷雾于确定的作物区、非作物区和水域除草,也可以利用作物和杂草之间的高度差异、出土展叶期差异以及某些生物形态结构的差异,有选择地从作物中除去不同的杂草。

由于农达®具有独特的化学特点,世界已承认它是现代农业中一项最重要的农药发明。十多年来,它一直是全球所有农药销售中销量第一的产品,可见其深受世界农民的欢迎。

 

 

 

 

    化学结构和性质:

化学名称:

 N—(膦酰基甲基)甘氨酸

N—(phosphonomethyl)giycine

理化性质:

原药为非挥发性无色晶体,熔点约230°C并伴随分解,堆积密度0.5g/cm³,

水中溶解度1.2%(25℃),不容于一般溶剂。其异丙胺盐完全溶于水,不可燃,不易爆,常温下贮存稳定。

产品及规格:

含原药异丙胺盐41%,表面活性剂15%和水,外观为红色透明粘性液体,比重1.166(25℃),沸点>100℃,不挥发,不燃不爆,对光稳定不分解,使用时完全溶解于水,常温下贮存稳定期2年以上。(如图)

毒性:

按中国农药毒性标准,农达®747为低毒农药,对皮肤及眼睛只有轻微刺激:

 

. 农达®原药不易被动物胃肠吸收,不经代谢直接由肠道和肾排出,在体内无积累

现象。

. 试验条件下,试验动物繁殖三代未见异常。

. 大鼠两年饲喂试验,无副作用:每日31—34mg/kg

. 狗一年无副作用:>每日500mg/kg

. 人每日允许摄入量0.3mg/kg,因食品中农达®含量极低或可以忽略,美国环境保护

机构不列做限制农药。

无残留性:

农达®入土后即与铁、铝等离子结合而失去活性,被土壤颗粒迅速吸附而无游离存在,所以植物根部不能吸收,对土壤中潜藏的植物种子无杀伤作用,不妨碍种子萌芽生长,用药后播种或生长的任何作物上和水中无残留或可以忽略,对地下水无污染危险。

农达®在土壤微生物作用下很容易被分解为二氧化碳、硝酸盐、磷酸盐和水等天然物质,不损害环境,土壤中的半衰期少于20天。

对目标植物的作用方式:

从茎叶渗入植物体内进入循环,随着叶片产生的糖和其他养分一起转移,抑制植物体内烯醇丙酮基莽草素磷酸合成酶,从而抑制莽草素向苯丙氨酸、酪氨酸和色氨酸的转化,使蛋白质的合成受阻,导致植物组织坏死。(图示)

特点:

 1.农达®以内吸传导性强而著称,不仅能通过茎叶传导到根部,在同一植株的不同分蘖之间也能有效的传导,对多年生宿根性杂草地下根茎的破坏力很强,能达到一般农业机具无法达到的深度。

    2.由于吸收及传导的过程与植物生长状况和环境因素有关,所以杂草死亡速率不一,可以明显看到目标植物茎叶的黄化和地上部分的逐渐枯萎过程,而包括地下部分的死亡过程一般需要7至15天。

3.农达®杀草普及广,据不完全统计,对40多棵的植物有优良防除作用,包括单子叶和双子叶,一年生和多年生,草本和木本等植物。虽然白合科、旋花科和豆科的一些植物抗性较强,但只要加大量剂,仍然可以有效防除。

使用适期:

农达®只由植物的绿色茎叶等部位吸收并向其他部位传导,最佳使用适期是现蕾至开花阶段,及生长量最大阶段。

所以若在多年生宿草根性杂草太小的时候喷洒农达®747,由于茎叶受药面积小受药量少,有可能仅杀死地上部分而不能连根杀死杂草。

在一年生或越年生杂草出苗后的所有生长阶段施药,均可将草除去,但是因为农达®不具有土壤封闭的残留活性,不能阻止杂草种子萌芽,所以对于施药之后出土的杂草,仍应继续使用农达®或用其他方法除草,如使用孟山都公司的和耐斯、马歇特、拉索或饶地奥等牙前除草剂进行封闭。

除草应用范围:

1.用于各种农作物的免耕栽培,如玉米、大豆、水稻、小麦等作物播种出苗前或蔬菜、油菜、甘蔗等作物幼苗移栽之前,除去地表杂草和上级作物的残茬。

2.用于各种已经成长的农作物行间喷雾除草,如棉花、甘蔗、玉米、棚架瓜果等高杆作物田,使用农达®防除植株行间生长的各种杂草,除了压低喷头之外,还应在喷雾器喷头上加上农达®定向喷雾保护罩或其他类似的防止农药雾滴飞溅到作物上的装置后除草,对于防止其他除草剂不能防除的宿根性多年生杂草,农达®有其特殊的应用价值。

3.用于各种果园、橡胶园、油棕园、桑园、茶园等经济林木,防除各种杂草。

4.用于幼林抚育、苗圃、和林区防火带除草,以及荒坡、林迹更新地等造林前化学除草整地。

5.用于田埂、沟渠、水塘、坡地、湖泊等有水的地方防除各种一年生杂草、多年生宿根性杂草和漂浮类杂草,如水花生(革命草)、水葫芦等。

  6.用于工矿企业、仓库、油田、公路和城乡环境卫生除草之用。

7.用于绿化草坪和园林景观区,利用涂抹等方法施药,防除非观赏性杂草灌木。

8.开荒地翻耕之前使用农达®除草剂,将宿根性多年生杂草杀死之后在翻耕,可以有效的减轻当年种植农作物除草的压力,加速土地的熟化。

选择性除草方法介绍:

1.高度差选择:果园、桑园等经济林木和棉花、甘蔗、玉米等农作物株行间除草,可以利用杂草与被保护植物之间高度的差异,压低喷雾器喷头,将农达®均匀喷洒在杂草叶片上,只要不喷洒到作物茎叶等绿色组织,即不会产生药害。若作物比较矮小或茎叶等绿色组织生长部位较低,容易沾染农药时,应在喷雾器喷头上加上农达®定向喷雾保护罩或其他类似装置防止药液飘溅到作物茎叶上,园林草坪等处可以采用药绳等涂抹方式除去杂草。

2.时间差选择:玉米、大豆、棉花和播种蔬菜等作物田,可以在播种前或播种后苗前使用农达®,利用它能杀死已出苗杂草而不残留防碍作物出苗的特点出去田间杂草,特别是一些较难防治的恶性杂草。

3.形态差异选择:茶叶等作物的叶片表皮组织角质化程度高,同时有复有一层蜡质。利用茶叶等作物与组织形态的差异,可以在成龄茶园中压低喷头,直接喷洒农达®,杀死茶蓬中和茶丛基部周围杂草而不伤茶树,一般可以在采茶2-3天之后喷洒。

4.人工遮盖方式选择:烟草、蔬菜等作物的秧苗或树苗或树苗移栽之后,可以用器具或塑膜套、盖、挡等到方式将幼苗遮护之后,喷洒农达®除草剂除去各种杂草。

杀草谱和剂量:

1.农达®除草剂可以防除几乎所有一年生,越年生杂草、多年生宿根性杂草和各种灌木。如果在适当的生长阶段,施用适当剂量的农达®除草剂 ,可以杀死一切绿色植物。

2.推荐剂量:

一年生和越年生杂草
 农达®150-200毫升/亩应用0.5-1%的浓度
 
多年生宿根性杂草
 农达®300-400毫升/亩应用1%的浓度
 
林区除草灭灌
 农达®400-800毫升/亩应用2%的浓度
 

3.施药方法:在喷雾器中先加入一半清水,将计算所得药量倒入喷雾器,再加入清水至额定容量,略加搅拌之后,即可均匀喷雾。7至10天后,杂草连根杀死。喷洒农达®后,不宜扰动杂草,以免影响药效。农达®每亩对水量20-30公斤,不宜太多,喷雾力求雾点细密,提高茎叶表面药液沾附率,不使滴落地面。

施药人员的个人防护同于一般农药使用方法。

4.由于各种杂草对农达®除草剂敏感性和差异,谨列举部分杂草的用药剂量供参考:

a.每亩使用农达®150毫升,可以防除以下较敏感的一处生和越处生杂草:(注:学名暂略,不同)稗、狗尾草、看麦娘、通泉草、牛筋草、马唐、卷耳、黎、繁缕、;猪殃殃等。

b.每亩使用农达®200毫升,可以防除以下较不敏感的一年生和越年生杂草:车前草、小飞蓬、鸭跖草、双穗雀稗等。

c. 每亩使用农达®300-400毫升,可以防除以下多年生宿根杂草:白茅、芦苇、硬骨草、香附子、毛茛、狗牙根、刺儿菜、野葱、紫菀、水蓼、蛇毒等。

d. 每亩使用农民®300-500毫升,可以防除以下杂灌和小乔木:丛桦、接骨木、榛材、野薇、山楂、山梨、山梅花、柳叶绣菊等。

e. 每亩使用农民®600-800毫升,可以防除以下抗性较强的杂草、杂灌和小乔木:芒萁、忍冬、胡枝子、白丁香、山槐等。

5.防止适期:一年生杂草可在株高10cm左右施药,多年生宿根性杂草株高30-40cm,灌木丛可在落叶前2个月用药。

湖泊、水面除草:

1. 农达®可以直接用于池塘、湖泊等水面防除各种水生杂草和湿生杂草。将药液均匀喷洒在长出水面之上的杂草叶片上,即可内吸传导于水面之下的茎叶和根茎组织发挥除草作用。但倘若茎叶全部或大部分沉入水中时,农达®虽喷洒于水面,由于未能碰到杂草绿色部分,仍不能发挥除草作用,请留意。

2.以下仅列举部分可以防除的水生杂草供参考(学名略):

空心莲子草(水花生、革命草)、芦苇、凤眼莲(水葫芦)、水浮莲、宽叶香蒲、水烛等

*剂量:农达®1%浓度的药液或每亩200-300 毫升

3. 农达®对水体的影响:

由于农达®完全溶解于水,故不会在水面或水底积聚,其在水域均匀扩散时,浓度在数小时内即会被稀释至百万分之一或更低,同在土壤中情况相似,会迅速被水中微生物分解为无害物质,在水中半衰期约14天,不会构成水源污染。研究证明:一般鱼和其他水生物都有耐受农达®的能力,并能迅速从体内排出。

对于长期杂草丛生的鱼塘等大面积滞留水面除草,建议分批化区施药,以保证杂草死亡腐败过程不会耗尽氧气导致池鱼缺氧。

美国、欧洲诸国、澳大利亚、新西兰、菲律宾等国家军批准在水域使用农达®除草。

林区除草:

1.营林与幼林抚育 :营林之前使用农达®除去杂草灌木丛之后再移栽树苗或飞播造林,可以有效的防止杂草与树苗竞争。幼林抚育使用农达®除去树苗周围的杂草使树苗在与杂草灌丛的竞争中解放出来,加速树苗生长。据试验,除草之后,如果每棵树苗周围有一平方米以上无草空间,树木的生长速度较之未除草状态至少增加两倍。

2.幼林抚育使用农达®除草时,若树苗基干部褐色部位较高,可以压低喷头并在喷头上装上农达®定向喷雾保护罩或其它类似装置,为防止喷溅到苗木绿色部分,若树苗矮小混生于杂草灌木丛之中,,可以利用塑料保护罩、纸袋等将苗木遮护后再喷施。

3.针叶树对农达®有较高的耐忍性,在针叶树苗休眠期,可以直接喷雾除去杂草灌木丛或采用飞机航喷农达®除草,建议与林业专家讨论,苗木长势、草相、杂灌种类、天气状况与剂量高低等施药方法之间的关系,将对除草效果有很大的影响。

4.林业除草(包括防火带除草)施用农达®一般采用叶面喷雾处理,每亩对水15-30公斤,也可根据需要,用喷枪点(穴)施或用涂抹法对高大杂草和灌丛处理。用树木注射器向非目的树种体内将农达®以5-10%浓度注射,也可以取得理想的效果。

农田换茬、行间免中耕及果园、胶园等经济林木除草方法:

    1.稻麦、玉米、麦棉、水稻、油菜和蔬菜换茬的田块,采用免耕少耕方法栽培时,可于前茬收获之后,参照前述草情和处理剂量使用本品除灭茬,一般在药后第二天便可以不经耕耙直接播种,以争取农时。免耕种植水稻的田块可在用药5-7天后灌水播种、抛秧或插秧。

2.麦-移栽棉花、油菜-移栽棉花、蔬菜换茬等育苗带土移栽的田块以及类似的育苗移栽换茬田块,采用免耕少耕方法栽培时,参照草情和剂量使用农达®除草。凡是营养钵育苗,肥团泥块育苗等带土移栽的作物,则应在药后3-5天移栽,防止移植后萎垂的作物叶片搭附在残茬或杂草茎叶上,受到被露珠溶解的残存药液的可能沾染,而导致叶片发黄。

3.棉花、甘蔗、玉米和棚架类瓜果等高杆作物生长中期,用农达®进行植株行间喷雾代替中耕除草时,可以在喷雾器的喷头上加上农达®定向喷雾保护罩之后,压低喷头进行定向喷雾,防止药液飘溅到作物的绿色部位。

4.一些作物因种子表皮较厚造成出苗时间较长或气候原因推迟出苗,期间若杂草发生量较大或残草复萌时,可以在作物出苗之前参照述草情和剂量,使用农达®除草剂没有残留活性,不影响作物出苗。

5.果园、桑园、茶园、胶园、油棕等经济林木的除草时,可以参照前述草情和剂量处理。由于农达®接触植株绿色部位才有除草作用,仅接触林木的褐色部分及树干部分不会造成伤害。农达®不具挥发性,不会灼伤幼嫩组织。

6.施药量

防除对象
 每亩使用药量
 每15公斤喷桶药量
 
灭茬
 150—200毫升
 3公斤
 
一年生杂草
 150—200毫升
 3公斤
 
多年生杂草
 300—400毫升
 4.5—60公斤
 
恶性杂草或林区灭灌
 400—800毫升
 6.0—12.0公斤
 

 注意事项:

1.农达®为内吸传导型灭生性除草剂,施药时注意防止药雾飘移到非目标植物上造成药害。

2.农达®容易与钙、镁、铝等离子络合失去活性,兑制药液时应使用清洁的软水,兑入泥水或脏水时会降低药效。

3.施药后4小时内遇中雨或大雨可能会降低药效。

4.施药后3天内请勿割草、放牧和翻地。

5.农达®对铁、铝等金属容器有轻微腐蚀性,应使用塑料等非金属容器贮存。

6.农达®已有专用高级助剂,使用时不需在加入助剂或洗衣粉等。包装破损时,高湿度下农达®可能会返潮结块,使用时充分搅拌药液,接块重新溶解,不会防碍药效。

7.使用农达®应遵守一般农药的安全使用操作规程,因农达®对眼和皮肤有轻微的刺激,不慎接触应用大量清水洗去,接触眼睛最好请医生诊治。使用农达®后的残液和洗涤喷雾器的水,不能倒入池塘或水流。

ml/亩 g/公顷 g/亩 g/ml mg/ul
150 922.5 61.5 0.41 0.41
170 1050 70 0.411764706 0.411764706
200 1230 82 0.41 0.41
250 1537.5 102.5 0.41 0.41
300 1845 123 0.41 0.41
400 2460 164 0.41 0.41
500 3075 205 0.41 0.41
610 3750 250 0.409836066 0.409836066
1 公顷= 15 亩
100 公顷= 1 平方公里(平方千米)(square kilometers)
c mg/l v ml v add ul v add rounded c mg/l re.
100 250 60.97561 61 100.04
50 50 6.097561 6 49.2
75 50 9.146341 9 73.8
100 50 12.19512 12 98.4
125 50 15.2439 15 123
150 50 18.29268 18 147.6
175 50 21.34146 21 172.2
200 50 24.39024 24 196.8
250 50 30.4878 30 246
300 50 36.58537 37 303.4
350 50 42.68293 43 352.6
400 50 48.78049 49 401.8
450 50 54.87805 55 451
500 50 60.97561 61 500.2
600 50 73.17073 73 598.6
分类: other Biology 标签:

[ZT]基因表达 RT-PCR之我见

2008年2月5日 Galaxy 没有评论

http://frankyuchina.spaces.live.com/blog/cns!DA13A7A70341F856!228.entry

基因表达 RT-PCR之我见

本文讨论的范围包括RNA酶保护分析,northernblot,原位杂交,半定量RT-PCR和定量RT-PCR。本文不谈具体protocol,是因为各种书籍和kit说明书上都有,主要说一些原则,而且大部分是失败和成功的经验,还有小组讨论结果以及各种书里七零八落看的内容,希望对大家有用。

>基因表达的定义:说到基因表达,是指RNA,还是蛋白?是指mRNA还是包括风头正旺的非编码RNA?mRNA还有不翻译的RNA呢。应该说转录水平指的是RNA水平,而蛋白应该叫翻译水平?我们这里就特指编码蛋白的mRNA的量的检测吧!

方法:很多很多,我们常用的也就是RT-PCR和northern。RNA没保护分析在国外很常用,也有半定量的功能,一次性试剂盒还能以此将一个表达簇一起分析,例如NFkB的转录激活谱中的8个常见基因。dot blot的最大贡献是发展到了反向dot blot的顶峰――曾经无限时髦的基因芯片,而原位杂交的放大效应和它的假阳性使它的定量(半定量,应该根本算不上定量),用它定位和用蛋白定位的意义不可同日而语,又难做,只有新发现的基因可以在没有得到蛋白和抗体的情况下进行组织或者细胞定位。

>先谈谈RT-PCR吧。关于原位杂交和dot blot大家可以和我论战的,我曾经看到一篇公开发表的文章把dot blot称为定量检测,是极端错误的。

1、模板均一性问题:愚见采用从RNA定量的方法似不妥,不要说PCR的本身的敏感度,即便是在反转录就有差异,到了cDNA的分装和用于模板的取样,这些都不能保证准确,当然在反转录阶段我们也经常控制在1或5ug,但这是为了再将来加样的时候保证大致差不多,而且尽可能地利用反转录酶,而且RNA定量本身即使用电泳也不是那么准,更不要说分光光度计,这里说一下,我曾经看到有人说用分光光度计定量,这也不是很准确,分光光度计只是掌握大概,当然用于反转录足够了,但是用于rt-pcr的定量这是不正确的,很不准的,RNA也最好至少要用电泳,一方面定量,另一方面可以看看完整性。至于用分光光度计比较不同标本之间就更不准了。

2、RNA制备:一般制备总RNA 即可,有时需要制备mRNA,个人认为初学者还是选择Trizol,大量制备采用传统的方法自己配,实际上和trozol一样的,有时效果还好,trizaol也就是混一混,但是优点在于质量保证,使用方便,效率高,根据不同组织用trizol一般可以提到全部RNA的50%(别小看,这已经很高了)以上,有些可以到达80%。mRNA用Qiagen的柱子,别去自己做Oligo(dT)柱,太麻烦。是否用DNAseI根据基因的特点和引物的设计,能够跨内含子的就不需要处理,处理还是很危险的哦。像这样的微量和也用不了多少次的实验,并且如果牵涉到样品是无价之宝的时候,因该选好的进口试剂。谈到RNA的贮存实际上主要是温度,至于放在TRIZOL中是不可取的,更不要说在胍里了,只-20是不够的,至少-80,液氮最保险,想想,在低温里,即使加上些RNA酶它也降解不了哇!qiagen出了一种easy产品可用于保存标本,但在常温也只是1天,所以低温才是首要的,抽的时候也是这样。

3、反转录:常规,取样尽量一致,如上所述,不是为了定量,是为了半定量PCR时图形的好看。选择逆转录酶根据实验需要,少量的可用Promega的一种1ug的酶,多的我们用invitrgen的5ug的II,当然有人说Promega和Roche的也不错,用过,的确可以,要不Invitrogen不像当初Gibco时那么牛了,也降价打折了。反转录成功后就不必太小心了,放在那里都可以,想想你还曾经72度灭活呢,是不是?要知道,杂合双链比DNA双链还稳定的。一般来说要扩增从反转录到PCR全过程的长达2kb以上的片断是相当困难的事,很多长基因是通过随机引物库得到的而不是通过Oligo (Td)得到的,不要说反转录,即使是PCR也是很困难的,不信可以从质粒里试试,至于反转录,就更是天方夜谭了,除了酶的效率等,还有RNA的二级结构等因素,这就要一些大公司的特殊的名贵的效果也未必好的酶了,Roche和Invitrogen都有的.听天由命吧。

>

4、半定量RT-PCR:重点,为什么是第4条?首先说明一下,半定量PCR,我是指基于凝胶成像分析的,定量PCR指实时PCR

实验设计:根据不同的实验,对于不同的基因要有不同的策略,还有不同的组织,选择不同的基因的转录本,选择不同的看家基因,都各自不同,对于文献不可照抄。

引物:对于RT-PCR重要的是引物的位置,有两种方法,一种是上下游引物设计在跨内含子的两个外显子的3’端和下一个外显子的5’端,这样不会在基因组上扩出来。第二种是我最喜欢的,设计在两个离得远的外显子上,这样从基因组和cDNA上得到得不一样,可以一引两用。以上原则对单外显子基因不使用,这是最好选择DNAaseI处理。另外,我们有一个好习惯,就是把退火温度设计成一样的,这样每次做的时候不用“三查七对”,从冰箱里拿出就坐。另外3′最后一个碱基是很重要的。

>昨天看到有人问5‘端得问题,本来以为这是大家都知道的,也在这里顺便说说,表达水平检测和开放读框没有关系,PCR的位置不需要在读框里,相反3’非翻译区反而同源性最低。而且如果用的是Oligo( dT),用3端更保险。再说一句,我从不用软件,全靠两只眼睛看,每每用一个上午,想想还有基因组呢,只看得两眼昏花。设计好以后,最好在查一下有没有同源序列,尤其是一个家族的基因。

关于mRNA和蛋白的一致性,mRNA是不能代替蛋白水平的分析的,因为还有翻译效率和RNA降解速度的影响,当然还有蛋白的剪切和分解速度等等,但是表达水平一般来说可以大致估计一种基因的翻译产物的,有时。但二者不能混委一谈。

基因组问题:如上所述,可以不用处理基因组的。但是如果是单外显子呢?曾经有以为朋友问我,她的样品中总是有基因组的污染,用RNA去p总能P出来。她先用trizol过两遍,再用qiagen过两遍,还能P出来。这是很多人碰到的问题,问题的关键是TAQ(除了具有DNA指导的)还有RNA指导的DNA聚合酶功能,所以是可以直接从RNA中P出来的!那就冒险让RNA高温一下吧,只是DNAase处理时一定小心,买大公司的,保险一些,至少也应该是takara的,买液体做好的,不要自己配,比起标本来,这时候银子已经退居其次了。

长度:我们认为500之内比较好,不受中间可能出现的各种序列和二级结构的影响。至于eeflying说的跑的在前会弥散则可以用2%的胶就行了。我一般是250左右。目的基因和内参照之间的大小比例可以根据爱好和胶的浓度、分辨率调整的。如果是250,则相差100bp很好,如果4、500则差个200bp也可以。

内参照:每一次一定要做内参。不作内参的结果是不可信的,实际上我想大部分半定量RT-PCR本身就是不可信的,不过我做的是可信的,因为我反复摸,重复做,每次作内参照,跟自己对照,用不同的酶,不同的体系,作出同样的结果(基因表达结果,不是条带什么的)。

>不管多少样品,内参不作,等于说比较珠穆朗玛峰和泰山的高度一样,没有海拔,泰山从地面的高度和珠穆朗玛峰从青藏高原的高度没什么差别。PCR一定要同时作,但是电泳可以不一起跑,没有关系,记住,计算的是相对表达程度,再说一遍我的观点:1、半定量和定量RT-PCR做的都是基因相对表达量,不是绝对表达量,除非你能准确知道来自多少细胞,但是细胞还有死的呢。2、以电泳为基础的半定量RT-PCR本身是不可信的,作为实验的粗筛是可以的,但不能作为最终结果的,不过我的可以。3、半定量RT-PCR应该在两管中进行,除非内参基因和目的基因表达相同,长度一致,目的扩增区域的GC含量相似,或者实在穷的要省PCR管和Taq酶。

>解释一下:

1、同一管中不是不可以,因为它有条件现同的优点,只要目的基因的扩增量和选择的不同循环数的内参照基因的最终扩增产量大致相同就很好,很拗口吧。但是一管中的竞争抑制实在是大问题,即使对照组一致了,咱做的是差异,总有不一致的,而且PCR的放大效应会把芝麻P成西瓜的哦。在不同管中重要的模板的平均分配,这不用多说了把。2、相对和准确的问题,PCR的相对定量是因为引入了内参照,所以没有绝对定量一说,至于半定量和定量的区别不是相对和绝对的区别,而是准确和不准确的区别。一般经常搞错的定量半定量和绝对量相对量的概念,定量半定量是指检测准确度,而绝对量相对量是指基因在组织中的表达丰度,例如Northen虽然不是很准(Northern不是很好的金标准),主要是上样量的原因,不管使用28s18s定还是用SB GAPDH或者β-actin都是,但是Northern得出的是绝对组织丰度,而实时荧光定量RT-PCR虽然准确(定量)但是得出的是相对表达丰度,不管使用β-actin还是用18srRNA。至于常规的通过跑电泳的所谓“定量”RT-PCR那就远了去了。

另外,似乎有人认为要做的好,就要把条件摸得哈好的,一旦很好,就不更改,PCR条件,徨论Taq酶,窃以为实不足取,为何?我说的“摸”是指循环数和模板,如果连taq也要固定下来,其不是别人重复不了了?因为检测的是相对量(反复强调),所以理论上在PCR过程和成像过程只要在线性期,结果应该是差不多的,为什么不说一样是应为即使在线性期也是有差异的,大家看看文后的我们做的定量PCR的图就知道了,在每个点的切线的斜率是不同的。

>

 

关于选择什么作为内参照的问题,实际上没有定论,个人认为,18s优于actin,不要跟我说GAPDH,著名的GAPDH都可以说是肿瘤相关分子了,其它还有tubulin什么的,因该差不多,实际上actin虽然相对来说很稳定的表达量,但我想在细胞分裂的过程中,需要骨架,因此actin等本身在不同细胞,不同组织、不同时期是变化的,我想,姑妄听之。作为骨架蛋白和细胞的分裂发育是密切相关的,在不同状态表达是不同的,不同细胞等。之所以用18s是因为相对而言核糖体RNA量相对稳定,因为它的功能是同整个基因谱有关的(负责装配),更重要的(我想的)它在总RNA中占地比例高,所以更准确,就像你用某一种东西的数量去概括总量,应该选那种多的,说一座房子是由2000块砖造成的,比说用29根梁更准确吧,当然你用的是mRNA就另当别论了。

摸:一定要摸,关键是摸,摸上3、5摸总是必要的,首先分开一个一个摸,然后再放到一起摸(特指同管PCR),直到摸的好了,还要考虑比较的不同的模板中的量,这就是因为下面谈到的线性期和平台期的问题。

线性期和平台期:根据上面摸的结果,选择线性期的起始周围的循环数作为PCR指数,这和定量PCR中的原理是一样的,这相当于取线性期曲线的切线(是不是这样?)。线性期似乎因该是指数期(我想的),只是因为2的幂和倍数正好一样?不要为了后期的亮度取线性期的晚期,那样是不准的,文后复一张自备的定量RT-PCR的图参考就明白了。本来想把模板量单列的,在这里说了吧,模板量应该越多越好,当然是指在条件允许和不影响PCR体系的情况下,也不是指把20ul都加上,还要摸呢,对吧。一般来说2ul要比1ul好,很多人会问,过了一个循环不久一样了么?不一样的,这和PCR本身的原理有关,什么原理我也不懂。就像到了线性期,很多人会说,再加酶,实际上不是的,再加酶和dNTP还有引物都没用的,其实这些本身就是过量的。

>综合上面两点,说说下面一点:一般摸出来的结果是什么呢?个人认为,再使用1ugRNA反转录后用2-4ul为模板和使用5ug反转录用1-2ul为模板的情况下,一般目的基因很少超过30循环,著名的β-actin很少超过25循环,如果你看到有人用actin和sb GAPDH超过28-30循环的话,结果是不可信的,实际上即使超过25循环也是值得商榷的,肯定再RNA或者cDNA的步骤有问题,此时因该增加模板量,而不是增加循环数,即使目的基因要用30以上也要考虑一下。对于想脾脏这样的组织,actin甚至可能要低于20循环,实际上在后文谈到的凝胶成像仪的检测范围之内,应该循环数越少越好。还是那句话,并不是在指数期就可以的。

提示:另外,不是很亮(跑电泳时)并不代表没有到平台期,再看看我们的做的定量PCR的图就明白了,有些基因的平台期是达不到很高的(这不是因为荧光标记得影响),要看你摸的时候不同循环的扩增产物的量之间的关系,在相邻之间的差异基本复合线性增长才是线性期。

>一步法还是二步法:我一直不建议采用一步法,因为逆转录酶很贵,就做一次PCR,多可惜啊!还有RNA。而且反转录了之后可以做10-20次,还可以摸条件找原因。不要以为一步法是盒子,实际上是一样的,操作没有什么不同,还没办法摸条件,早该淘汰了(特指RT-PCR过程中)。对于少量的标本用1ug的反转录酶既可以了,或者用于预实验都是很好的,但是P的时候要多加一点,之所以这些话总是不确定是因为还和你正在做的基因的风度有关。

关于凝胶成像分析:这是常人所未想的问题(晕倒一片),一般来说基于CCD的成像系统也有这个问题,这就是CDD本身的工作原理和软件的质量,有的CCD是重复扫描的,有的软件是只有256灰阶的,所以要注意上样量不要太多,当然也不要太少(以防看不到),否则会超出扫描CCD和软件的分析范围,这和PCR到线性期就没有什么不同了。另外很多软件有手动调节,这样的软件使用时要保持每次框起来的范围的大小的一致性,不要造成太多的人为误差,号召大家不要任意修改数据。此外,紫外灯管的质量、光的强度、均一性和CCD距离、焦距、分辨率都要注意。如果有钱买冷CCD当然最好了,不过其实一般用不着。实在不行的,拍了照再扫描再用photoshop分析也未尝不可,但是那可是很不准的,中间不周太多,而且如果是热敏打印机很容易亮度饱和的,不一定会有灰阶。

PCR反应:常规PCR什么的,实际上Mg2 什么的没有那么重要的,退火温度什么也没有什么的。别忘了两对引物的退火温度相同哦,即使在两管中也要这样,因为在一台PCR仪上,如果在一管中,还要考虑4条引物之间不互补。

复孔的问题:其实用这个办法很容易解决一些判断问题,作三个复孔很好,这在定量PCR常用对吧?但是如上文所属,如果模板足够多,这步可以省去去的。

定量PCR:其关键在于准确和起始模板可以微量,但也只是相对定量,特指RT-PCR,这里不讨论根据标准曲线检测基因啊病毒啊什么的绝对值。为什么是准确的相对定量,我再废话一会again,是指你不知道你的模板来源是多少,所以才用GP内参,话说回来,及时你知道多少个细胞,还有细胞生死的问题对不?这就是为什么说northern是不很准确(没有定量PCR准确)的绝对定量,是因为northern的模板多,综合分光光度计和28s/18s更复合实际情况些,尤其是在不同组织分布的研究中更有效。

>1、 原理:毕竟,PE是定量PCR的鼻祖,而且型号也一直在推陈出新。bio-rad和roche的也是很强的,各有优势,大家还是比一比,价格、功能、性能、服务,尤其是技术支持,有些公司的技术支持强可以帮我们很多忙的。还有最近基因公司也有一种新的不错的。

>2、 Taqman:常见原则,方法简单,原理易懂,结果可靠。同管不同管和上面一样的,只是还多了问你的仪器有没有双波长检测滤镜,而且双波长有时在一管中也有影响。

>3、 仪器选择:PMT和CCD各有千秋,不要听信一家之言。能兼容96孔板和普通PCR管的最好,96控板便宜而且一致性较好,至于边缘效应实际上没有那么明显得,只要做个对照就明白了。最好能兼容各种方法、试剂和耗材的,以防后“费”无穷。速度不重要,但是其中一家公司的变性时间短也是不容小觑的优势,对整个实验速度还有TAQ酶的影响小,当然没有也没大关系,毕竟taq现在都很好。

>4、 结果分析:要注意不同的探针的标记效率,分开设域值线还是放在一起要根据实际情况,即目的基因和参照基因的CT值的差距,CT(还是T,很想CS嘛)的倍数也可以改的。

总结一句,(我最在行的)半定量RT-PCR一般来说基本上是g p。

分类: other Biology 标签:
Locations of visitors to this page