人工知能を使った機械翻訳プログラム作成

昨日は人工知能セミナーの10回目でした。

内容は前回に引き続きDeep Learningです。

  • 再帰型ニューラルネットワーク(RNN)
  • Long short-term memory(LSTM)
  • RNNの変形(multi-layer RNN、bi-directional RNN)
  • seq2seqモデル(機械翻訳プログラム作成)
  • twitter感情分析プログラム作成

今回学習したRNNは、文章や動画、時系列金融データなどの連続した特徴を処理可能な手法です。現在機械翻訳や音声認識など幅広い分野で使われています。

機械翻訳プログラム作成

RNNの各種モデルについて学習した後に、seq2seqを使った機械翻訳を行うプログラム作成を行いました。20,000センテンス程の英語→中国語の翻訳結果を読み取りseq2seqモデルで機械学習を行います。

エンコーダー・デコーダーは共にLSTMを用います。SimpleRNNだと直近の特徴量は反映可能ですが、少し離れた特徴量間での影響がほとんど無くなるので翻訳の制度が落ちるとの事です。

実際作成したプログラムの翻訳結果は中々の精度でした。

twitter感情分析プログラム作成

最後にtwitterのツイートがネガティブな内容かポジティブな内容かを判断するプログラムを作成しました。10万件のツイートを読込、Embeddingレイヤーでテキスト処理後にLSTMを行うモデルを作成します。

 

 

 

百度のブロックチェーン技術を使ったゲーム「度宇宙」

先週ブロックチェーンセミナー参加者用Wechatグループで話題になっていた「度宇宙」
f:id:denim012:20180622212300j:image

百度が今月リリースしたブロックチェーン技術を使ったゲームです。

 私もインストールしてみました。
f:id:denim012:20180622212838j:image

ゲームの内容は「元素」を集めて自分の惑星を大きくしていくと言うもので、この「元素」がブロックチェーンのトークンに当たります。

「元素」を増やす方法は今現在2種類のみ。1つはW杯のサッカーくじです。
f:id:denim012:20180622214038j:image

勝ち・負け・引き分けに賭け当たれば配当が貰えます。もう1つは、時間が経過すると「元素」が自然発生するのでそれを収穫します。保持している「引力」が多ければ発生する「元素」も多くなります。

正直、ゲームとしては全然面白くは無いですが、以前流行ったイーサリアム上の「CryptoKitties」のようにリアルマネーでのトレード期待からか先週時点で登録者は100万人を超えています。

ゲームを遊ぶには電話番号と身分証明書番号(パスポートはNG)の登録が必要なので、日本人が遊ぶのはちょっと面倒です。

中国の人工知能セミナー(Deep Learning)

昨日は人工知能セミナーの9回目でした。

内容はディープラーニング(深層学習)についてです。

  • 人工ニューラルネットワーク(ANN)
  • ディープラーニングとフレームワーク
  • 畳み込みニューラルネットワーク(CNN)
  • CNNでCIFAR-10の画像分類プログラム作成

ディープラーニングは近年急速に普及している手法で自動運転車、スマートスピーカー、音声翻訳など幅広い分野で使われています。

人工ニューラルネットワーク(ANN)

ニューラルネットワークを学習させるbackpropagationを実データで計算して理論を理解します。隠し層やニューロン数をどの程度に設定するのがよいかは明確な答えが無いので、scikit-learnのMLPClassifierで各種ハイパーパラメータを設定して検証します。

畳み込みニューラルネットワーク(CNN)

Googleが開発したディープラーニング用ライブラリtensorflow、kerasの使い方を学んだあと、kerasを使用してCNNを使ったプログラムを作成します。

飛行機、自動車、鳥、猫、鹿等の10種類5万枚の画像データを学習した後に1万枚の画像で正しく画像分類が出来たか確認します。

ディープラーニングのフレームワークではtensorflowの方がシェアが高いですが、初心者には扱いにくいため今回はkerasを使った実習でした。

中国のブロックチェーンセミナー(PPkPub)

今日はブロックチェーンセミナーの4回目でした。

今回の講師はPPk技術コミュニティの発起人。内容はPPkが現在協議しているブロックチェーンを用いた新しいネットワーム網についてです。

  • ブロックチェーン技術の核心
  • World Wide Webの成功がブロックチェーン発展に与える啓示
  • 異なるブロックチェーン間でのネットワーク通信
  • PPk技術コミュニティでの研究成果

現在のIPアドレスを用いたインターネットの問題点とブロックチェーン技術を最大限に生かすための新しいネットワーク網をどのように実現するかについて話がありました。

ODIN(ブロックチェーンネットワークでのDNS)、PTTP(ブロックチェーンネットワークでのHTTP)など等の詳細の説明があったのですが全く興味がもてませんでした。

他のセミナー参加者からも「話し方が大学のおじいさん教授のようで眠くなる」、「面白くない」など散々な評価でした。

コンビニのデリバリーサービスが激安

昨日は始めてコンビニのデリバリーサービスを使ってみました。

ファミマの618セールで「饿了么」経由で39元買うと20元の割引。

f:id:denim012:20180618113828j:image

更に「饿了么」アプリ起動時に12元分の割引クーポンがもらえます。
f:id:denim012:20180618113842j:image

配達料金も無料のため、39元分買って実際の支払金額は7.3元でした。

注文してから到着まで12分と自分で近所のコンビニに買いに行くより早く着きました。

人工知能を使った中国株の自動売買

昨日は人工知能セミナーの8回目でした。
内容はクオンツ分析(Quantitative analysis)についてです。

  • クオンツ分析の基礎
  • Pandasの日付データ操作
  • 金融データ取得(TuShare)
  • クオンツ分析の流れ
  • JoinQuant上で動作するBackTestプログラムの作成

pythonの中国株データ取得ライブラリ(TuShare)で取得したデータに対して、resampling・downsampling・upsampling・rolling手法で各種分析指標を計算します。それらの特徴量を使用して今まで学習した各モデルで機械学習を行い株価が上昇・下落するか予測します。

TuShareの使い方

TuShareを使用すると中国株に関する株価・ニュース・会社情報を簡単に取得することができます。PandasのDataFrame型で取得するためデータ編集も容易です。

import tushare as ts
import pandas as pd
#浦東銀行(コード:600000)の6月のデータを取得
pufa_data = ts.get_k_data(code='600000', start='2018-06-01', end='2018-06-15')
pufa_data.set_index('date', inplace=True)
print(pufa_data.head())
date open close high low volume code
2018-06-01 10.60 10.68 10.69 10.53 183655.0 600000
2018-06-04 10.76 10.75 10.83 10.70 161803.0 600000
2018-06-05 10.71 10.66 10.75 10.61 186926.0 600000
2018-06-06 10.64 10.55 10.64 10.53 149836.0 600000
2018-06-07 10.56 10.62 10.66 10.51 233556.0 600000
#最新ニュースを取得
ts.get_latest_news()
classify title time url
0 美股 硝烟正浓的中美贸易战,核心竟然是储蓄率! 06-16 20:44 finance.sina....
1 美股 首家赴美上市PE诞生 三次发声力挺猎豹 击退做空机构 06-16 20:44 finance.sina....
2 美股 快递巨头暗战:申通韵达与顺丰分手 要投向阿里怀抱? 06-16 20:18 finance.sina....
3 美股 埃及政府开斋节突涨油气价格 06-16 16:57 finance.sina....
4 美股 一个反复无常的美国 是美国的最大难题 06-16 16:52 finance.sina...

BackTestの実施

プログラム実習では、オンラインのBackTestプラットフォーム( JoinQuant)に自動売買プログラムを配置して、過去の相場でのシミュレーションを行いました。

自動売買プログラムで買いサインが出たらWechatに通知することもできるので、プログラム通りに実際に株式売買することも可能です。

また、去年から京東でもBackTestプラットフォームを公開しているので、こちらも使用することが出来ます。
quant.jd.com

中国のブロックチェーンセミナー(ウォレット)

昨日はブロックチェーンセミナーの3回目でした。

このセミナーは毎回講師が異なり、今回の講師はブロックチェーン資産ウォレット(財布)の専門家でした。ビットコインの公式サイトで推奨されているBitherの開発者です。「ウォレットの安全性」をテーマに講義を行います。

  • Bitherについて
  • プラットフォームの仮想通貨盗難事件
  • ウォレットの脆弱性問題
  • 個人の仮想通貨盗難・紛失
  • ブロックチェーンの今後

について話がありました。

仮想通貨取引所での盗難はニュースとして報道されることがありますが、実際には個人に対する盗難・紛失の方が頻繁に発生しているそうです。

バックアップを取らずにスマホやPCが故障してウォレットの通貨が取り出せなくなったり、パスワードをWechat上やオンラインストレージ上に保存して盗まれる等といった初歩的な問題がほとんどです。

今後のブロックチェーン技術の発展については、今年からDAPP(分散型アプリケーション)の普及が始まると考えられるため、優良なDAPPをまとめたプラットフォーム(Apple Storeに似たもの)を作成したいそうです。