求助关于OrthoMCL抠图软件在线使用的使用

关注今日:0 | 主题:98560
扫一扫,下载丁香园 App
即送15丁当
求助关于OrthoMCL软件的使用!
页码直达:
各位有谁用过OrthoMCL软件进行同源蛋白的分析,按照操作步骤进行到第七步的时候:大家帮我解释一下All-v-all BLAST具体是如何进行BLAST呢?参考的链接:========= Step 7: All-v-all BLAST =========Input:
- goodProteins.fastaOutput:
- your_blast_results_in_tab_formatYou must run your own BLAST.
For large datasets you should consider gaining access to a compute cluster.We expect you to:
- use NCBI BLAST
- run with the -m 8 option to provide tab delimited output required by Step 8
- for IMPORTANT DETAILS about other BLAST arguments, see:
the OrthoMCL Algorithm Document (/document/d/1RB-SqCjBmcpNq-YbOYdFxotHGuU7RK_wqxqDAMjyP_w/pub)If you are a power user you can deviate from this, so long as you can ultimately provide output in exactly the format provided by NCBI BLAST using the -m 8 option, and expected by Step 8.If you are a super-power user you can deviate from that, and also skip Step 8.
But you must be able to provide the exact format file created by that step as expected by Step 9.
The tricky part is computing percent match.
不知道邀请谁?试试他们
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
blastp 一般是用自己的序列做query去已知蛋白库比对。all to all就是用所有的蛋白序列建blast库,然后用所有的蛋白序列作为query去比对。旧版blast需要formatdb和blastall命令,blastall输出文件要选择tab format, 参数为 -m8blast+版本需要makeblastdb和blastp两个命令,blast输出文件选 tab format 参数为-outfmt 7例句#BLAST 2.2.29+makeblastdb -in your_protein.pep -input_type fasta -dbtype prot -out name_your_blast_database -logfile makeblastdb.log -title my_blastp_database# Protein-Protein BLAST
blastp -db name_your_blast_database -query your_protein.pep -out selfBlastPlus_m8.txt -evalue 1e-10 -num_threads 23 -outfmt 7
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
这个可以在线作,比自己作方便点哦。话说楼主是如何安装的阿?Fedora 20下我没有搞定。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
我的基本想法是想把一个未知的蛋白组与13个一致的植物蛋白质组进行OrthoMCL构建同源蛋白组。这个直接在线做可以吗?另外我的blast版本blast_2.2.26,每次做完blastp后,hit的第 ID总是有问题,它会自动命名编号,不知道什么原因?求助各位大仙,谢谢 。附:Cucu|Csa1P
30124_Arab.fasta
84.0Cucu|Csa1P
19_Arab.fasta
66.6Cucu|Csa1P
21858_Arab.fasta
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
关于丁香园关注今日:0 | 主题:98560
扫一扫,下载丁香园 App
即送15丁当
求助关于OrthoMCL软件的使用!
页码直达:
各位有谁用过OrthoMCL软件进行同源蛋白的分析,按照操作步骤进行到第七步的时候:大家帮我解释一下All-v-all BLAST具体是如何进行BLAST呢?参考的链接:========= Step 7: All-v-all BLAST =========Input:
- goodProteins.fastaOutput:
- your_blast_results_in_tab_formatYou must run your own BLAST.
For large datasets you should consider gaining access to a compute cluster.We expect you to:
- use NCBI BLAST
- run with the -m 8 option to provide tab delimited output required by Step 8
- for IMPORTANT DETAILS about other BLAST arguments, see:
the OrthoMCL Algorithm Document (/document/d/1RB-SqCjBmcpNq-YbOYdFxotHGuU7RK_wqxqDAMjyP_w/pub)If you are a power user you can deviate from this, so long as you can ultimately provide output in exactly the format provided by NCBI BLAST using the -m 8 option, and expected by Step 8.If you are a super-power user you can deviate from that, and also skip Step 8.
But you must be able to provide the exact format file created by that step as expected by Step 9.
The tricky part is computing percent match.
不知道邀请谁?试试他们
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
blastp 一般是用自己的序列做query去已知蛋白库比对。all to all就是用所有的蛋白序列建blast库,然后用所有的蛋白序列作为query去比对。旧版blast需要formatdb和blastall命令,blastall输出文件要选择tab format, 参数为 -m8blast+版本需要makeblastdb和blastp两个命令,blast输出文件选 tab format 参数为-outfmt 7例句#BLAST 2.2.29+makeblastdb -in your_protein.pep -input_type fasta -dbtype prot -out name_your_blast_database -logfile makeblastdb.log -title my_blastp_database# Protein-Protein BLAST
blastp -db name_your_blast_database -query your_protein.pep -out selfBlastPlus_m8.txt -evalue 1e-10 -num_threads 23 -outfmt 7
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
这个可以在线作,比自己作方便点哦。话说楼主是如何安装的阿?Fedora 20下我没有搞定。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
我的基本想法是想把一个未知的蛋白组与13个一致的植物蛋白质组进行OrthoMCL构建同源蛋白组。这个直接在线做可以吗?另外我的blast版本blast_2.2.26,每次做完blastp后,hit的第 ID总是有问题,它会自动命名编号,不知道什么原因?求助各位大仙,谢谢 。附:Cucu|Csa1P
30124_Arab.fasta
84.0Cucu|Csa1P
19_Arab.fasta
66.6Cucu|Csa1P
21858_Arab.fasta
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
关于丁香园求助关于OrthoMCL软件的使用_百度知道
求助关于OrthoMCL软件的使用
我有更好的答案
话说楼主是如何安装的阿,比自己作方便点哦这个可以在线作?Fedora 20下我没有搞定
其他类似问题
为您推荐:
下载知道APP
随时随地咨询
出门在外也不愁关注今日:1 | 主题:48375
扫一扫,下载丁香园 App
即送15丁当
【转载】同源基因查找软件OrthoMCL的使用
页码直达:
OrthoMCL ()主要用来找直系同源基因以及旁系同源基因。它主要在比较完整的基因组之间找直系同源基因。OrthoMCL的使用主要13步,可以参考doc/OrthoMCLEngine/Main/UserGuide.txt。为了方便运行OrthoMCL,可以建立一个工作目录“my_orthomcl_dir”。1&配置OrthoMCL程序将orthomcl.config.template拷贝到你工作目录下(my_orthomcl_dir)。然后根据所建的mysql数据库名,用户名,密码。修改该文件。例子如下:主要有两个阈值参数:percentMatchCutoff:blastsimilarities with percent match less than this value are ignored.evalueExponentCutoff:blastsimilarities with evalue Exponents greather than this value are ignored.2& 利用orthomclInstallSchema命令对Oracle或者Mysql数据库进行配置Usage:orthomclInstallSchema config_file sql_log_file table_suffix比如在my_orthomcl_dir目录下运行:../orthomclSoftware-v2.0.9/bin/orthomclInstallSchemaorthomcl.config.template orthomcl.config.log。3& 利用orthomclAdjustFasta命令把输入文件转换为orthomcl所需的文件格式Usage:orthomclAdjustFasta
taxon_code
fasta_file
id_field这里从Ensembl下载了Ustilago maydis和Saccharomyces cerevisiae两个物种的蛋白质组文件。../orthomclSoftware-v2.0.9/bin/orthomclAdjustFasta
Ust Ustilago_maydis.fasta 1../orthomclSoftware-v2.0.9/bin/orthomclAdjustFasta
Saccharomyces_cerevisiae1就会生成两个文件:Ust.fasta 和Sac.fasta。为方便运行my_orthomcl_dir/compliantFasta/。参数意义如下:4& 利用orthomclFilterFasta命令过滤掉差的序列文件Usage:orthomclFilterFasta input_dirmin_length max_percent_stops [good_proteins_file poor_proteins_file]例如运行:“../orthomclSoftware-v2.0.9/bin/orthomclFilterFasta
./compliantFasta/”。之后就会生成两个文件:goodProteins.fasta与poorProteins.fasta。参数意义如下:5& Blast比对对上一步得到的goodProteins.fasta进行多对多的比对。推荐使用NCBIBlast.我这里使用是ncbi-blast-2.2.28+。运行命令:“~/Universal_softwore_src/ncbi-blast-2.2.28+/bin/makeblastdb-in good_proteins.fasta
good_proteins.fasta”“~/Universal_softwore_src/ncbi-blast-2.2.28+/bin/blastp-db
goodProteins.fasta -querygoodProteins.fasta -outfmt 7 –out goodProteins_blastp.out ”。然后生成tab delimited格式的输出文件goodProteins_blastp.out。生成的比对文件最好是tab文件格式。不同的版本的输出格式参数也许不一样。该软件就是-outfmt 7。得到该文件之后需进一步处理之后才能被后面的步骤所使用(只把hits行挑选出来,注释信息丢掉)可以运行如下命令得到:“grep -v -P&^#& goodProteins_blastp.out & goodProteins_v1_blastp.out”。6& 利用orthomclBlastParser命令将上一步得到的blast比对结果进行解析,默认阈值为e-value:1e-5 ;Coverage:50%Usage:orthomclBlastParser blast_file
fasta_files_dir运行命令:” ../orthomclSoftware-v2.0.9/bin/orthomclBlastParser
goodProteins_v1_blastp.out
./compliantFasta”运行完之后生成similarSequences.txt文件。参数意义如下:7& 利用orthomclLoadBlast命令将blast结果导入到mysql数据库中Usage:orthomclLoadBlast config_file similar_seqs_file运行命令如下:“../orthomclSoftware-v2.0.9/bin/orthomclLoadBlast
orthomcl.config.template
similarSequences.txt”参数意义如下:8& 利用” orthomclPairs”对数据库中的SimilarSequence表中数据,进行pairs的运算Usage:orthomclPairs config_file log_file cleanup=[yes|no|only|all]&startafter&运行命令如下:“../orthomclSoftware-v2.0.9/bin/orthomclPairs
orthomcl.config.template
pairs.log cleanup=yes ”默认情况,下,在mysql中生成三个表: PotentialOrthologs,PotentialInParalogs, PotentialCoOrthologs。参数意义如下:9& 利用命令orthomclDumpPairsFiles对数据库中的pairs表进行处理Usage:orthomclDumpPairsFiles
config_file运行命令如下:“../orthomclSoftware-v2.0.9/bin/orthomclDumpPairsFiles
paris.log”参数意义如下:生成mcllnput文件和pairs目录。这个目录包含三个文件:ortholog.txt, coortholog.txt, inparalog.txt。每一个文件有三列: proteinA, protein B, their normalized score (See the Orthomcl Algorithm Document)。10& 利用mcl程序把上一步的结果进行聚类运行命令如下:mcl ./mclInput --abc-I 1.5 –o ./mclOutput 具体参数可以参考mcl文档。11& 利用orthomclMclToGroups命令将mcl的输出结果转换为groups.txtUsage:orthomclMclToGroups my_prefix 1 & mclOutput & groups.txt运行命令如下:参数意义如下:groups.txt就是最终的结果文件。文件中的每一行代表可能存在的蛋白质家族。 &/startafter&
不知道邀请谁?试试他们
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
楼主可不可以帮忙找一下K-ras基因作为胰腺癌原癌基因在其他物种中的同源基因啊,或者找Kloth基因也行,谢谢!
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
关于丁香园

我要回帖

更多关于 软件使用说明书 的文章

 

随机推荐