所属Affiliation

Research

  • 高性能計算High performance computing
    • 低精度/混合精度演算Mixed precision computing
    • 大規模計算Large scale computing
  • 量子計算機シミュレーションQuantum computer simulation

Skills / Hobbies

Work experience

  • 2022.02 - Present
    NVIDIA Compute DevTech InternNVIDIA Compute DevTech Intern

Graph:

TA/RA/Mentor

  • 2017.04 - Present
    横田理央研究室 RA
  • 2017.04 - Present
    Research assistant at Yokota Lab, School of computing, TokyoTech

Educational background

  • 2020.04 - Present
    東京工業大学情報理工学院情報工学系(博士課程)School of computing, TokyoTech (Ph.D Student)

  • 2018.04 - 2020.03
    東京工業大学情報理工学院情報工学系(修士課程)School of computing, TokyoTech (Master)
  • 2014.04 - 2018.03
    東京工業大学工学部情報工学科(学部)School of computing, TokyoTech (Master)
  • 2010.04 - 2013.03
    埼玉県立川越高等学校Kawagoe high school, Saitama prefecture

Research

SGEMM emulation on NVIDIA TensorCores with error correction method

Tensorコアは混合精度行列積和演算回路です. Tensorコアへの入力行列は半精度である必要があり,これが行列積の精度を劣化させます. この劣化はTensorコアの特長を活かした精度補正計算を行うことで緩和でき,これに加えTensorコア内部の一部の丸め(RZ)を上手に回避することでFP32と同じ精度で行列積を計算できるようにする研究を行っています. 詳しくは 論文 をご覧ください.
TensorCores are specialized hardware for matrix multiplication and addition and are available on the latest NVIDIA GPUs. Converting input matrices to half precision on TensorCores results loss of accuracy. We recover the accuracy using an error correction technique and avoiding the rounding inside Tensor Cores (RZ). See our paper for more detail.

Publications & Presentations

Other publications / presentations

Projects

High performance ATSUKAN Computing

I built a GPU cluster to make hot sake (atsukan;熱燗). Each node has two NVIDIA Tesla K20 GPUs and liquid cooling modules. Gathered heat through cooling water is used to heat up sake.
Blog (Japanese)
8枚のNVIDIA K20xの排熱を利用して熱燗を作るための計算機クラスタを作成しました。 Blog (Japanese)

What can a thief steal?

I put a private key printed on a paper at the university. How much time and interest can I steal from people? [detail (Japanese)}
秘密鍵を印刷した紙を大学内に置きました。 [詳細]

WMMA API extension

An extension library for WMMA API (TensorCore API).
wmma-extension - GitHub
Tensorコアを効率的に用いるための拡張ライブラリ。
wmma-extension - GitHub

Baking Jomon pottery縄文土器

I get clay from the ground and bake Jomon pottery(縄文土器). Blog (Japanese)
自宅の庭を掘って粘土を取り出し縄文式土器を焼いています。 Blog (Japanese)

Pizza ovenピザ窯づくり

I built a pizza oven in my parents house.
Blog (Japanese)
試行錯誤しながら家にピザ窯を作っています。
Blog (Japanese)

Computer parts accessories廃PC部品アクセサリ

I make accessories from old/broken computer parts.
Web page (Japanese)
廃PC部品を再利用してペンダントなどのアクセサリを作成しています。
Web page (Japanese)

NN-Image

A web service which generates undirected fully-connected graph.
nn-image
全結合ニューラルネットワークの画像をさくっと作れるWebサイト。
nn-image

Iceberg wallpaper generator

A web service which generates iceberg-style wallpaper.
iceberg-gen
icebergっぽい画像を作成するWebサイト。
iceberg-gen

cutf

A tiny CUDA template wrapper for myself. This library contains from standard memory operators to experimental floating point operators.
cutf - GitHub
CUDA関係のオレオレ拡張ライブラリ。 cutf - GitHub

vico - a tiny job queue

An tiny job queue (scheduler) using tmux.
vico - GitHub
tmuxのセッションを利用したジョブキュー。
vico - GitHub

Awards

iOS Apps

乱数生成

メルセンヌ・ツイスタで疑似乱数を生成するアプリ

Random number generator

色比較

カメラから得た2種類の色を比較するアプリ

Color comparison

Links

Advent calendar

Contact