2006年11月08日

[R] igraphで関連ネットワーク描画

昨日もお伝えしましたigraphに関する話題です。

例えば遺伝子発現プロファイルなどにおいて、実験条件や時系列にわたって遺伝子Aの発現パターンと遺伝子Bの発現パターンを比較する際に、類似度が導入されます。そのパターンの特徴間の類似性ネットワークは関連ネットワーク (relevance network) と呼ばれており、類似度によく用いられるのは相互情報量や相関係数などです。

この関連ネットワークは、多変量データ行列が得られていれば簡単にigraphで図示できます。


-------- 以下はごく簡単な描画例


# 乱数から成る10×10のデータ行列を作成
# 実際の解析では、matには相関行列が入ることが多い
mat <- matrix(runif(100), nr=10)

# 値が0.9以上のものを線でつないでプロット
plot(graph.adjacency(mat>=0.9, mode="undirected"), layout=layout.circle)



これで、data(Golub_Train)でロードされる38サンプル×3051遺伝子のデータ行列などから相関行列を求めて、関連ネットワークを描くことも容易になりました。

cor.png


banner_03.gif ←人気blogランキングに参加しております
posted by soreyuke at 13:00| Comment(0) | TrackBack(0) | Bioconductor | このブログの読者になる | 更新情報をチェックする

2006年11月07日

[R] igraphを用いたネットワーク分析

ご存知の方も多いかと思いますが、自分用のメモのために記しておきます。

頂点 (vertex or node) と線 (edge or link) から構成される、いわゆるグラフ (=ネットワーク) を取り扱うためのオープンソースライブラリにThe igraph libraryというものがあります。これはRでも利用可能 (インストールも簡単) であるため、凝った分析(統計解析含め)を行いたいときなどに便利かと思います。


The igraph library
http://cneurocvs.rmki.kfki.hu/igraph/

----------- 以下はごく簡単なサンプルRソース

# erdos-renyiのランダムグラフを作成
g <- erdos.renyi.game(100, 3/100)
# 描画
plot(g, layout=layout.fruchterman.reingold,vertex.size=4, labels=NA, frame=TRUE)

# BA (Barabasi-Albertモデル)によってscale-freeなグラフを作成
bg <- barabasi.game(10000, power=1)

# degree distributionの描画
plot(degree.distribution(bg), xlab="degree",
ylab="frequency", log="xy", pch=4, col=4, type="b")


random.png

degree.png


banner_04.gif ←人気blogランキングに参加しております
posted by soreyuke at 19:25| Comment(0) | TrackBack(0) | Bioconductor | このブログの読者になる | 更新情報をチェックする

2006年11月06日

Rでバブルプロット

三つ変数組のデータを二次元平面上にバブルプロットする描き方をメモっておく。

n <- 50
x <- rnorm(n)
y <- rnorm(n)
z <- rnorm(n)
re.norm <- function (z) {
z <- abs(z)
z <- 10*z/max(z)
z
}
z <- re.norm(z)
op <- par(mar = c(3,2,4,2)+.1)
plot(x, y, cex = z, pch = 16, col = "blue",
xlab = "", ylab = "",
main = "")
points(x, y, cex = z)


bp.png
posted by soreyuke at 19:07| Comment(0) | TrackBack(0) | Bioconductor | このブログの読者になる | 更新情報をチェックする

2004年11月02日

FirefoxバージョンのAmazon、A9ウェブ検索ツールバー

logo-a9

Firefox 用のA9.com検索ツールバーがリリースされました。もちろん、Macintosh・ Linux・Windowsに対応しています。インストールしたら、A9.comのサイトの右上にあるPreference (or Prefs)というところで、日本語を選択するとよいです。

使ってみた具合がどんなかっていいますと、こんな感じですね。↓

a9-tb

A9.com検索ツールバーは、ユーザーがお気に入りのサイトを保存したり、どのPCからでもアクセスできるようにするブックマーク機能・ダイアリー機能などがあります。



関連記事

ITmediaニュース:Amazon.com子会社のA9、ツールバーでFirefoxに対応
http://www.itmedia.co.jp/news/articles/0411/02/news013.html

ITmediaニュース:Amazon、A9ウェブ検索ツールのFirefoxバージョンをリリース
http://www.itmedia.co.jp/news/articles/0411/02/news024.html
posted by soreyuke at 11:07| Comment(0) | TrackBack(0) | Bioconductor | このブログの読者になる | 更新情報をチェックする

Bioconductor 1.5 リリース

予定通り昨日、Bioconductor 1.5がリリースされました。R-2.0.0 であることが必要なようですが。CRANではR-2.0.0 for Windowsも提供されています (rw2000.exe)。

Bioconductor
http://www.bioconductor.org/

The R Project for Statistical Computing
http://www.r-project.org/
posted by soreyuke at 10:32| Comment(0) | TrackBack(0) | Bioconductor | このブログの読者になる | 更新情報をチェックする

2004年10月13日

R 2.0.0 for Windows に待った!?

先ごろ、R 2.0.0 が提供されはじめましたのはこのブログでも紹介したとおりです。ソースのみの提供から、いまCRANではR 2.0.0 for Windows (rw2000.exe) も提供されています。

ただ、R 2.0.0とBioconductor との不具合がメーリングリストやここでも議論・報告されていますので、今月末に予定されていますBioconductor 1.5リリースを待つのが得策かと。
posted by soreyuke at 12:12| Comment(0) | TrackBack(0) | Bioconductor | このブログの読者になる | 更新情報をチェックする

2004年10月05日

R 2.0.0 リリース!!

R-Announceに2.0.0のリリースがアナウンスされましたね。約半年振りのメジャーバージョンアップ。現在、CRANにはソースだけがあります。1.9.Xからの変更点など、詳しい情報は下記を参照のこと。


[記事] R 2.0.0 is released
https://stat.ethz.ch/pipermail/r-announce/2004/000792.html


Rプロジェクト
http://www.r-project.org/


いやー、本来ならばコンパイルしてインストールして感想の一言でも書くべきなんですが、、、。(^^;
posted by soreyuke at 11:30| Comment(0) | TrackBack(0) | Bioconductor | このブログの読者になる | 更新情報をチェックする

2004年09月10日

Bioconductor affy パッケージ その1

ひとまず自分の仕事に必要なaffyパッケージから攻めてみようかと思います。このパッケージは、Affymetrix社のoligonucleotide array (GeneChip)を解析するための拡張可能でインタラクティブなデータ解析環境を提供する関数群から成っています。GeneChipの蛍光情報から発現情報を取り出す関数やら、蛍光強度そのものの表示、PM/MM強度の表示なんかもする関数などがあります。

・・・と、ここまで書いてきて、えらいマニュアルと格闘せねばならないことに気付きました。まず、データ解析するにしても統計学的なバックグラウンドが必要ですよね。GeneChipの発現解析に関する統計学はひとまずこれは押さえておかないとなりませんね。

http://www.affymetrix.com/support/technical/technotes/statistical_reference_guide.pdf

それからaffyパッケージに関しても、

http://www.bioconductor.org/repository/devel/vignette/affy.pdf

は必須ですよね。あぁなんだかめまいが・・・。(^^;
これぐらいの英語読めって感じですけど。

ぼちぼちやっていきまーす。



注: PM…パーフェクトマッチ
   MM…ミスマッチ
posted by soreyuke at 21:48| Comment(0) | TrackBack(0) | Bioconductor | このブログの読者になる | 更新情報をチェックする

2004年09月09日

Bioconductorで使用するXMLパッケージ

XMLパッケージを導入しようとして、ここからWindows binary最新版XML_0.97-0.zipをダウンロードしました。Install package(s) from local zip files...でインストールしたは良いのですが、

> library(XML)

と読み込もうとすると、、、

XML_error


プロシージャエントリポイント _htmlDefaultSAXHandler がダイナミックリンクライブラリ libxml2.dllから見つかりませんでした。


と無情にも文句を言われてしまいました。(^^;
いったい何のことですかぁ〜!?w って感じです。そこで、いろいろググってみたのですが、わかりません。なぜ?WHY?

ま、結局、XMLパッケージのバージョンを落とすことによって一応の解決となりました。http://www.stats.ox.ac.uk/pub/RWin/から

XML_0.95-6.zip

をもらってインストール。
posted by soreyuke at 14:28| Comment(0) | TrackBack(0) | Bioconductor | このブログの読者になる | 更新情報をチェックする

Cygwin でR & Bioconductorを使う3

次にBioconductorパッケージを導入します。オフィシャルサイトにも書いてあるんですけどね。Bioconductor Install Script というものを使います。
Rterm上で以下のコマンドを打ちます。

> source("http://www.bioconductor.org/getBioC.R")

> getBioC()

すると、勝手にダウンロードしたりインストールしたりしてくれます。じつに楽チンですね。どうもCRANが管理してないパッケージ(?)なんかは、各自ユーザがダウンロードしてきてRGuiを使ってPackagesメニューからInstall package(s) from local zip files...を選んでインストールすることになります。同様にBioconductorからもインストールすることができます。

Install package(s) from Bioconductor...

install_biocond

これをやると、導入可能なパッケージ一覧がポップアップします。

biocond_pack

これで足りないパッケージだとか、目的のパッケージを選びます。やはりarray解析用のパッケージなど充実してる感じがしますね。←適当w
posted by soreyuke at 10:56| Comment(0) | TrackBack(0) | Bioconductor | このブログの読者になる | 更新情報をチェックする

2004年09月08日

Cygwin でR & Bioconductorを使う2

2. Rのインストール
2.1. RのオフィシャルのCRANリンクをたどって、Windows用のセットアップファイル rw1091.exe (released on 2004-06-21)をダウンロードします。一応、我々は胃腸の弱い日本人なんで、Japanのカテゴリにあるサイトからもらってきましょう。

Windows (95 and later)
    ↓
    base
    ↓
rw1091.exe

で、たどりつけるはずです。これを適当なフォルダに保存します。

2.2. rw1091.exeを実行します。つまりダブルクリックします。

2.3. セットアップの途中でインストールフォルダはどこにするか?などといくつかの質問がありますが、適当に答えていきます。いや、表示されるとおりでよろしいのです。

2.4. Pathを通します。これはすでに、Cygwinのインストール過程で習得してる方が多いと思います。Win2000やWinXPの方は、マイコンピュータからシステムプロパティに入り、詳細設定の環境変数のところに書き加えるわけですね。Win98の方はたしか、autoexec.batとかに直接書き加えることになると思います。普通にアイコンをダブルクリックしてGUIを使って操作する方は、この項目は飛ばしてもらって結構です。

2.5. CygwinのターミナルからRを使うようにしたいと思います。基本的には、R1.9.1がインストールされたフォルダ (おそらくC:\Program Files\rw1091だと思います)をCygwinがインストールされているフォルダ (おそらくC:\cygwinだと思います)に移動し、C:\cygwin\rw1091\binをPATHに加えるだけです。この際、シェルの設定ファイル (bashでしたら、.bashrc) に次の一行を書き加えます。

export PATH=$PATH:/cygdrive/c/cygwin/rw1091/bin


これで晴れて、CygwinのターミナルからRを起動する準備ができました。心の準備はよろしいかな?


$ Rterm.exe
R : Copyright 2004, The R Foundation for Statistical Computing
Version 1.9.1 (2004-06-21), ISBN 3-900051-00-3

R is free software and comes with ABSOLUTELY NO WARRANTY.
You are welcome to redistribute it under certain conditions.
Type 'license()' or 'licence()' for distribution details.

R is a collaborative project with many contributors.
Type 'contributors()' for more information and
'citation()' on how to cite R in publications.

Type 'demo()' for some demos, 'help()' for on-line help, or
'help.start()' for a HTML browser interface to help.
Type 'q()' to quit R.

[Previously saved workspace restored]

>

以上のように、メッセージが出てRが起動しました。なお、この"$"はCygwinのプロンプト、">"はRのコマンドプロンプトを表します。では、さっそくデモプログラムを動かしましょう。

> demo(graphics)

どーですか、お客さんっ!!素晴らしい図がたくさん堪能できたと思います。こんなことができるソフトが無料、つまりダータですよ。

次回は、いよいよBioconductorの導入です。といっても説明するほどのことも無い気がしますね。

NICE 'N' EASY!!

・・・おっと大事なことを忘れてました。Rを終了するときには、

> q()

とします。

Save workspace image? [y/n/c]:

と聞かれますから、思い出を残したければyを、忘れてしまいたい方はnと打ってください。なお、cはキャンセルです。
posted by soreyuke at 17:01| 静岡 ☁| Comment(0) | TrackBack(0) | Bioconductor | このブログの読者になる | 更新情報をチェックする

Cygwin でR & Bioconductorを使う1

PC-UnixやMacをお使いの方々には激しくどうでも良い話題なのですが、はじめの一歩というわけでインストール方法も兼ねてメモっておきます。あ。なお私自身の環境はWinXPです。


1. Cygwinのインストール
Cygwinというのは、簡単に言いますとUNIX上のツール (シェルですとか、GCCなどのプログラミング環境、viemacsなどのエディタ群、果てはXウィンドウ環境まで)をWindows上で使用可能にするものです。と、すごい大雑把な説明なんですが、Cygwinに関して正確な概念や情報がここで絶対に必要かと問われればノー!ですので、この説明でオッケーですね。

さて、CygwinをRにさきがけて導入しておくのはオススメですよ。なんでかって、結局のところR (Bioconductorもです)はコマンド主体ですよね。コマンドに慣れておくって意味でも、はたまた職場であなたが気づかない間に、上司が背後からモニタを覗き見したところで、あなたがコマンドを打っている姿を見れば、ほめられることはないにしろ怒鳴られることは95%無いですからね。

というわけで本題のインストールですが、あまり説明することはありません。ホントは環境設定だとか、やれPATHを通せだのと細かい設定があるのですが、いまはgoogleで検索したりする方がよっぽど説明のうまいページにたどり着くことができます。また近年では、Cygwinの解説本もちょこちょこ書店で見かけるようになりましたし。よって、ここではホントのエッセンシャルを伝えるに留めます。w


Cygwinのオフィシャルサイトに突撃せよ。


です。


次回は
Rのインストール

NICE 'N' EASY!!
posted by soreyuke at 15:36| Comment(0) | TrackBack(0) | Bioconductor | このブログの読者になる | 更新情報をチェックする

インストールしました

Bioconductor、、、最近巷で話題沸騰の統計解析環境 R 上で動作する、バイオに特化した (microarray解析や配列解析など) 解析環境です。

Rについてご存知の方もそうでない方も、本サイトから有用な関連サイトにリンクを貼っておきましたので、思い立ったら即始めてください。Bioconductor については、英語のサイトが主です。日本語で学べるようになるまでは、いましばらく時間がかかりそうですね。だから、、、

このサイトを立ち上げました!!

と、まぁ息巻いてるわけですが、まだ私自身、ちぃ〜っともBioconductor について解っておりません。英語読むのがメンドくさいからやーめた!と言ってしまっては、何も思い出が残りませんので、わからないながらも Bioconductor をいじり倒し、言葉の壁の高さに苦しみ、のたうちまわる様を記録していくのも良いかと思った次第でございます。

まぁゆっくりと進んでゆくと思いますので、よろしくお願いします。って、誰に言ってるのか不明ですが。(^^;

NICE 'N' EASY!!
posted by soreyuke at 14:56| Comment(1) | TrackBack(0) | Bioconductor | このブログの読者になる | 更新情報をチェックする

広告


この広告は60日以上更新がないブログに表示がされております。

以下のいずれかの方法で非表示にすることが可能です。

・記事の投稿、編集をおこなう
・マイブログの【設定】 > 【広告設定】 より、「60日間更新が無い場合」 の 「広告を表示しない」にチェックを入れて保存する。


×

この広告は1年以上新しい記事の投稿がないブログに表示されております。