北海道大学大学院情報科学研究科

ストリングアルゴリズム

繰返し構造分析

ゲノム塩基配列には、繰返しが非常に多く存在し、それらは構造や進化に深い関わりがあると考えられています。繰返し構造には主にタンデムリピートと呼ばれる連続する繰返しと、SINE(short interspersed nuclear element)やLINE(long interspersed nuclear element)と呼ばれる散在して現れる繰返し構造があります。当研究室では、連続する繰返し構造には最小繰返し表現文字列による分析手法を、散在繰返し構造にはギャップの数を制限することにより高速省メモリで動作する頻出近似パターンマイニングアルゴリズムによる分析手法を開発しています。

rrs.jpg[図の説明] 繰返し表現文字列で生物の染色体の塩基配列を表現するとその圧縮率は繰返し密度のみでなく、繰返し構造の違いにも依存して決まり、種特有の値を取ります。

PAGETOP
Copyright © 情報認識学研究室 All Rights Reserved.
Powered by WordPress & BizVektor Theme by Vektor,Inc. technology.