top of page
fukushimadiaryoffi

日本語だとデータを見つけるのが大変



おはようございます。ルーマニアは日曜の朝で、久しぶりに太陽が出ております。コロナウイルスの弱点は日光だそうで、冬至でも正午の日差しに15分程度当てると90%が不活性化されるらしいです。なのでこれから冬になってきますが、風邪を引かない程度で外で太陽光を浴びるのは重要になってくるかと思います。


ノンアルコールビールを飲みながら、オックスフォード大学がOur World in Data(データで見る私達の世界)というシリーズ名で提供しているコロナウイルス関連の統計を見ていたら朝食から昼食の時間になってしまいました。これは世界の200を超える地域での感染数死亡数はもとより、ICU使用率や検査数など、関連しそうなデータをまとめた統計です。こういった統計はジョンズ・ホプキンス大学なども提供していますが、なぜか日本にはないような印象を受けます。少なくとも僕は見たことがないです。日本で出ているのはあくまで日本の中だけの数字で世界を比較したものではないんですね。報道各社が綺麗にグラフにしたものもありますが研究者向けではないですし、内容の充実度もOur World in Dataと比べて足元にも及びません。しかも、他国のこういった統計と比較して進歩がなく、見るたびに思わず唸ってしまうような進化が見られないのが特徴です。


僕はもともと日本では新卒のときからデータの分析に関わることをやってきました。もう15年近く前の話しで、当時はエクセルを使っていました。今このサイトでやってる分析をエクセルでやろうとしたら大変というよりも不可能だと思います。しかも、母から知恵なき子といつも呼ばれていた通り知恵がなかったので、発見したことを素直に周りに伝えて煙たがられていました。どうも日本は情報と分析を世界の他の国に比べて軽んじているような気がしてなりません。これは今に始まったことではなく、第二次世界大戦や遡れば白村江の戦いに関してまで言えることです。どちらも日本は大敗を喫しました。


昔からデータの分析に関わってきたとは言え、まだぎりぎり古い技術でもなんとか出来たので直感も使いながらだましだましやってきたわけですが、コロナウイルスに関する分析に伴って仕方なくプログラミングを覚えだしたのが5月14日でした。まず何から手を付けていいのか全く分からなかったので日本語でも英語でも色々調べました。驚いたのが、学習環境の差です。日本語だと有料で何ヶ月もかかる勉強内容が、英語だとYoutubeで4時間でした。もちろん何回も止めたり進めたりしたので実際には数日かかったわけですが、始めてから2週間でコロナウイルス感染数と各国の人口密度の相関のなさなどは見つけられました。英語で教えている人のほとんどがインド人や、時間のあるアメリカ人の若者、一番参考になったのはカナダのどこかの山奥で木こりのようなことをしながらYoutubeで数学やプログラミングを教えている男性のチャンネルでした。プラットフォームの広がりがあまりにも違いました。日本はデジタル庁とか言っていますが、これは突き詰めれば言語の問題にぶち当たると思います。


アメリカではコロナウイルス感染が世界最悪のレベルで広がっていて、イギリスはそれに加えてBrexitという難題を抱えています。両国に共通するのは社会の分断です。以前モンスターという記事で少し触れましたが、アメリカでは長期経済低迷と思われていた90年代クリントンの時代に、アラン・グリーンスパン元連邦準備制度理事会議長が経済統計からIT関連産業が急成長していることを「発見」しました。アメリカは政府がITを成長させたのではなく、成長していたことを発見したんです。ともかく、ここでこの圧倒的生産性を誇る産業に乗れた人と乗れなかった人の間に分断が起こりました。イギリスの場合はロンドンを中心とした巨大金融産業の急成長に乗れた人と乗れなかった人の間に分断を起しました。伝統的な産業での雇用を守るか守らないかということが今のアメリカとイギリスの混乱の発端になっているわけです。日本やフランス、ドイツはどちらかというとそれを半笑いで見ているわけです。しかしこれは実は望ましいことではありません。日本などの国は変化が起こったけれども分断しなかったのではなく、そもそも変化が起こらなかっただけなのです。一枚岩ではあるけれども、全体として沈んでいってる一枚岩と言えるでしょう。


世界のコロナウイルス関連情報に追いつくためにニューヨーク・タイムズやフィナンシャル・タイムズなど複数の新聞を購読しています。よく見ると分かるんですが、記事を書いている人の少なくとも半分が中国系の名前です。学術論文も中国系の名前が研究者に全く出てこないものはかなり少なく、記事のベースになっているデータ分析の層まで掘り下げるとヒスパニック系やインド人の名前も必ずと言っていいほど出てきます。英語圏は、こういった膨大な知にアクセス出来ています。ネットワークはプレイヤーの数に応じて加速度的に複雑化していきます。ネットワークに接続していない部分は取り残され、いつの間にかそもそも接続出来ないレベルまで時代遅れになってしまいます。コロナウイルスの感染力はもちろんながら、僕はこういったことにも日々危機感を抱いています。

閲覧数:379回0件のコメント

最新記事

すべて表示

Comments


bottom of page