Personal Page of Ryo Watanabe

渡辺 僚 (WATANABE Ryo)

博士(情報科学)

北海道大学大学院 情報科学研究科 情報理工学専攻 数理科学講座 情報認識学研究室

060-0814 北海道札幌市北区北14条西9丁目 北海道大学大学院 情報科学研究科 10-05

+81-11-706-6854

ryo[at]main.ist.hokudai.ac.jp

Index

Publications

Journals

In English

  1. Ryo Watanabe, Atsuyoshi Nakamura and Mineichi Kudo, An Improved Upper Bound on Expected Regret of UCB-Type Policies for a Matching-Selection Bandit Problem. Operation Research Letters, 43: 558--563, 2015.
  2. Ryo Watanabe, Junpei Komiyama, Atsuyoshi Nakamura and Mineichi Kudo, KL-UCB-Based Policy for Budgeted Multi-armed Bandits with Stochastic Action Costs. IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences, E100-A (11): 2470--2486, 2017.
  3. Ryo Watanabe, Junpei Komiyama, Atsuyoshi Nakamura and Mineichi Kudo, UCB-SC: A Fast Variant of KL-UCB-SC for Budgeted Multi-Armed Bandit Problem. IEICE Transaction on Fundamentals of Electronics, Communications and Computer Sciences, E101-A (3): 662--667, 2018.

International Conferences/Workshops

Non-archival

  1. Ryo Watanabe, Atsuyoshi Nakamura and Mineichi Kudo, A New UCB-Like Algorithm for Permutation Bandit Problem. NIPS Workshop on Bayesian Optimization. Lake Tahoe, NV, US, Dec 2013.

Domestic Conferences/Workshops

With Proceedings

  1. 渡辺 僚・中村 篤祥・工藤 峰一,Bandit手法による制約条件下でのWeb広告選択.第4回データ工学と情報マネジメントに関するフォーラム (DEIM2012),E9-4,兵庫県神戸市,2012年3月.
  2. 渡辺 僚・中村 篤祥・工藤 峰一,マッチング選択多腕bandit問題の効率的解法アルゴリズム.人工知能基本問題研究会 (第86回),29--34,北海道北見市,2012年8月.
  3. 渡辺 僚・中村 篤祥・工藤 峰一,順列バンディット問題における新しいUCB型アルゴリズム.コンピュテーション研究会,COMP2013-26,9--16,鳥取県鳥取市,2013年9月.
  4. 渡辺 僚・中村 篤祥・工藤 峰一,処理時間の長短を考慮した確率的多腕バンディット問題へのUCB戦略の拡張.人工知能基本問題研究会(第96回),29--34,愛知県名古屋市,2015年1月.
  5. 渡辺 僚・中村 篤祥・工藤 峰一,予算制約付き多腕バンディット問題に対するKL-UCBの拡張戦略.第18回情報論的学習理論ワークショップ (IBIS2015),IBISML2015-75,167--174,茨城県つくば市,2015年11月.
  6. 渡辺 僚・小宮山 純平・中村 篤祥・工藤 峰一,確率的コストを伴う予算制約つき多腕バンディット問題に対する漸近最適方策.情報処理北海道シンポジウム2016,183--190,北海道釧路市,2016年10月.

Without Proceedings

  1. 渡辺 僚・中村 篤祥・工藤 峰一,順列バンディット問題に関する考察.ERATO湊離散構造処理系プロジェクト 2013初夏のワークショップ,北海道札幌市,2013年6月.
  2. 渡辺 僚,複数選択多腕バンディット問題に対する決定的漸近最適方策に向けて.基盤(S) 離散構造処理系プロジェクト 2016年度 秋のワークショップ,北海道札幌市,2016年11月.
  3. 渡辺 僚,予算制約付き多腕バンディット問題における閉形式で表現可能な方策について.基盤(S) 離散構造処理系プロジェクト 2017年度 秋のワークショップ,北海道厚岸郡厚岸町,2017年11月.

Thesis

博士(情報科学)
Analysis of the Policies for Budgeted Multi-Armed Bandit Problem and Matching-Selection Bandit Problem,北海道大学大学院 情報科学研究科 情報理工学専攻,2018年3月.
修士(情報科学)
順列バンディット問題におけるUCB型戦略に関する研究.北海道大学大学院 情報科学研究科 コンピュータサイエンス専攻,2014年3月.
学士(工学)
制約付きBandit問題としてのWeb広告のオンライン配信に関する研究.北海道大学 工学部 情報エレクトロニクス学科 コンピュータサイエンスコース,2012年3月.

Awards

研究奨励賞
情報処理北海道シンポジウム2016,2016年10月

History

Affiliation

FromToWhat
1989年11月北海道釧路市生まれ
2005年4月2010年3月釧路工業高等専門学校 情報工学科
2010年4月2012年3月北海道大学 工学部 情報エレクトロニクス学科 コンピュータサイエンスコース
2012年4月2014年3月北海道大学大学院 情報科学研究科 コンピュータサイエンス専攻 修士課程
2014年4月2018年3月北海道大学大学院 情報科学研究科 情報理工学専攻 博士後期課程
2014年10月現在人工知能学会 学生会員
2016年11月現在情報処理学会 学生会員

Activities

FromToWhat
2012年度前期情報エレクトロニクス演習 TA (北海道大学 工学部 情報エレクトロニクス学科)
2012年度後期コンピュータサイエンス実験II TA (北海道大学 工学部 情報エレクトロニクス学科 コンピュータサイエンスコース)
2013年度前期全学共通科目「ロボットは知能を持つか」 TA (北海道大学)
2014年度前期全学共通科目「ロボットは知能を持つか」 TA (北海道大学)
2015年度前期コンピュータサイエンス実験I TF (北海道大学 工学部 情報エレクトロニクス学科 コンピュータサイエンスコース)
2016年6月2018年3月科研費 基盤(S) 離散構造処理系プロジェクト(離散構造処理系の基盤アルゴリズムの研究)RA
2016年11月2018年2月JST/CREST[情報計測]「一細胞ラマン計測と情報科学の融合による細胞診断の迅速解析技術の開発」 RA
2016年度冬ターム情報理工学実験II TA (北海道大学 工学部 情報エレクトロニクス学科 情報理工学コース)

Contents

Research Interests