FASTA格式是一種基於文本的標準格式,主要用於表示核酸序列或多肽序列。以下是關於FASTA格式的詳細信息:
序列表示。FASTA格式中,核酸或胺基酸使用單個字母表示。序列可以包含一個或多個序列,每個序列由序列名和序列數據組成。
序列名和注釋。每個序列的第一行以「>」符號開頭,後面跟隨序列名和可選的注釋信息。序列名必須是唯一的,以便於後續分析軟體區分不同的序列。這一行可以包含序列的來源、功能或其他相關信息。
序列數據行。序列的第二行開始為序列本身,可以跨越多行。為了方便閱讀,每行通常包含80到120個字元的序列。
通用性。FASTA格式是生物信息學領域廣泛使用的標準格式,適用於存儲DNA、RNA和蛋白質序列等生物序列信息。它被許多生物信息學工具所支持,如序列比對、基因組注釋和序列分析等。
此外,FASTA格式的發明人是威廉·皮爾森和戴維德·李普曼。