中国の翻訳サイト

コラボレーションに基づく中国の翻訳サイトが紹介されている。

The Wikipedia of news translation: Yeeyan.org’s volunteer community

Aside from reading stories, users can perform two basic actions: recommend a story or a URL for translation, or translate a recommended story.

Yeeyan.orgは英語のサイトを中国語に翻訳して公開するサイトだ。読者は訳して欲しいページを送ったり、逆にそういったページを翻訳することができる。

The site’s design encourages participation in a number of different ways. The front page prominently displays a staff-curated selection of recommended but as-yet-untranslated articles.

もちろん翻訳者を集める方が難しいので、そのために一通りの工夫がしてある。ユーザーごとに翻訳したストーリーのリストやコメントの数、バッジを表示するなど、大抵のフォーラムにあるサイトへの貢献を促す仕組みを備えている。

Beginning translators tend to produce rough texts and make many mistakes, says Kitty, but “it is cruel if we don’t even provide a chance.”

さらに、翻訳の質にはこだわっていない。厳しい管理をすると翻訳を始めようとするひとを遠ざけてしまう。これはQ&Aベースのフォーラムなどで重要な視点で、初心者を上手く取り込むための試みだ。フォーラムであれば初心者向けの専用ページを作るのもその一つだ。

Under international law, permission from the copyright holder is generally required to create or publish a translation. By publishing user-supplied translations of arbitrary news material, Yeeyan creates a public good in a legally dubious fashion.

しかし、勝手に翻訳を公開するのは、翻訳権の侵害である。これは日本でも英語サイトを全訳する場合に問題となる(例えばこのブログでは全訳は避け、常に自分の意見が主になるように心がけている)。

Even so, Yeeyan is actively seeking agreements with copyright holders to create and publish translations of their work.

そのため、Yeeyanは著作権者に対して翻訳を作成・公開する合意を取り付けるべく努力していて、既に有名サイトであるReadWriteWebの中国版を公開している。

But there’s money to be made offline if you have access to a huge pool of translation talent, and connections to publishers on both sides of the language divide.

Yeeyan自身は著作権の問題もありあまり広告収入を上げていないが、翻訳家のプラットフォームとして機能することで収益をあげているようだ。翻訳で稼ぎたい人が集まりYeeyan上でニュースなどを翻訳、そこで認知され、実際の仕事を受注する。仕事を手に入れる評判作りとスキルアップのために、公共財を提供するというのは(仕事につながらない)Wikipediaよりもオープンソース開発に近いだろう。

Twitterとイノベーション

はてなブックマークの人気エントリーページがリファラにあったので見に行ってみたら、最近書いた記事複数に関連するエントリーがあった:

小野和俊のブログ:Twitterの危険性

はてなの伊藤さんがTwitterを使っていない挙げた理由の一つが取り上げられている:

私も含めて、Twitterを始めてからブログの更新頻度が激減した、という人はかなり多いのではないかと思うが、こうした現象がなぜ起こるのかを考える と、感情が蓄積し、ある程度の時間をかけてブログのエントリを起こそうというところまでたどり着く前に、Twitterで思ったことをポロッとつぶやい て、同調したり、同情したり、コメントをくれたりする人がポツポツと現れたりしている過程で、蓄積しつつあった感情が心の蛇口から漏れてしまう、というの が最大の原因であるように思える。

これは先週書いた次の二つのポストと共通する問題だ:

前者は経済学者が特許制度に書いた学術論文が題材で、後者は数学者がウェブ上で協力して研究を行うことが題材だった。これとTwitterの危険性とがどうからむのか。

先の論文においてBoldrinとLevineはこう述べている:

In this model, that is unambiguously bad, as scientific resources  are misallocated to industrial applications when it would be better, from a social point of view, to use them in producing more original research that would, optimally, be brought to industrial fruition somewhat later.

特許が存在するために、本当ならより深く掘り進めてから最終的な成果を発表すべき研究が早すぎる段階で公表されてしまうと言う。これは、うまく特許制度を設計することで累積的なイノベーションの各段階に適切なインセンティブを与えようという一般的な文献とは相反する考え方だ。そしてこの違いがどこからくるかについて以下のように書いた:

知的財産権に関する経済学の問題はアイデアの実現に対して適切なインセンティブを与えることだ。よって、まずアイデアがどのように社会で生成されるかという創造的環境に関する仮定が必要になる。一つは既知の課題への解を見つけるというモデル、もう一つはアイデア自体が希少な場合だ。もちろんはこれらは両極端で実際には様々な程度がある。

これは経済的問題だけにとどまらない。根底にはアイデアがどのように生まれてくるかについての二つの考え方がある:

  • アイデアは希少で、いかにそれを公開させるかが課題
  • アイデアは豊富で、いかにそれを実現させるかが課題

ブレインストーミングは前者を前提にしたテクニックだ。いいアイデアを思いついた人はその場でそれを口にする。そのアイデアがよければ瞬時にまわりの人間から同調や建設的発展という心理的報酬を得る。先に引用したTwitterでつぶやくことによる感情の蓄積からの開放はこれに近い。例えば、輸入品のネット販売をしている会社が新しい商品分野の開拓を考えているとしよう。この場合社員にブレインストーミングをさせるのは適切な方法だ。商品が決まればどういう風に輸入して売るかというのは決まってくる。アイデアを出す段階でそこまで考える必要はないし、売り方を知らない人がアイデアを出しても構わない。それよりも早く公開させることで他の人が別のアイデアを思いつく材料になるかもしれない。

逆に建築のコンペは後者に立脚したメカニズムだ(ビジネスに関するコンペでもよい)。例えば、家族のコミュニケーションの流れを壁のスリットを使って表現した建築というアイデアがあったとしてもそれ単独ではあまり価値はない。本当に難しいのはそのアイデアをどう実現するかであってアイデアそれ自体ではない。そもそもアイデアの価値自体がそれがどう具現化されるかによって決定されるといってもよい(スリット云々は私がたった今でっちあげたものだ)。このような状況では、早い段階から参加者に討論をさせても生産的ではないだろう。そこでいくら議論を深めても最終的な形=価値が見えないからだ。もちろんある程度のやりとりは重要だろうがその場合でも言葉ではなく例えばデッサンによるものになるだろう。

Twitterの危険性は本来後者が有効なタイプのイノベーションについて前者のような方法が取られてしまうことの問題点と理解できる。これはオンラインで共同研究をやるときの注意点と同じだ。研究の場合の課題は手間のかかる論文の生産を避けて遥かに簡単なブログ記事の執筆で終わってしまうことだが、ブログとTwitterの関係も程度の差こそあれ本質的には同じ問題だ。

しかし、オンラインでの研究・Twitterと特許制度の問題との間に重要な質的な差が存在することには注意が必要だろう。特許制度においては前者が適切な場合に後者を適用したり、後者が適切な場合に前者を適用したりすることが問題となる。だが、どちらが適切かを考えて適用するのは制度設計者だ。後者が適当だと考えているのに前者を適用してしまったなどという問題は起きようがない。これは先のブレインストーミングやコンペの場合でも同じだ。ブレインストーミングをするか、企画書の提出を要求するかを決めるのは経営者だ。経営者はより適切な方法を選択する。同様にコンペにするか特定の設計事務所に相談にいくかを決めるのは建築主だ。つい間違った方法を選んでしまう人はいない。ではTwitterや研究の場合にはなぜ「危険」が存在するのか。

二つの原因がある。一つはTwitterや研究の場合にはアイデアを思いつき実行する主体が、そのアイデアによって長期的な利益をでる人間と一致することだ。上の輸入業者や設計事務所の例ではアイデアを出す人間は経営者や建築主によって雇われており、彼らが最適な方法を選択する。しかし、個人が思いついたことをTwitterに書くべきかブログに書くべきかを指示してくれる外部の人間は通常存在しない。もう一つの原因は技術進歩だ。Twitterが存在しなければTwitterとブログで迷うことなどありえない。インターネットがなければ研究についてブログに書くか、論文を完成させるかなどという問題は生じない。これはTwitterや研究に限らない。例えば、VoIP技術の発展は海を跨いだブレインストーミングを可能にした。しかし、企業はブレインストーミングが不適切な状況でビデオ会議はしない。「危険」は上の二つが同時に当てはまる場合にのみ顕在化する

この問題への対策は二通りだ。一つはどういう風にアイデアを公開すべきかをよく考えて慎重になることだ。リンク先の、

Twitterでもときどきやる気や意気込みを宣言している人を見かけるが、これはTwitter + やる気宣言のあわせ技で、相当量の感情がこぼれ出てしまっていると思われるので、よく注意しながら宣言することをお勧めしたい

という助言がそれだ。ある目標を達成しようとする自分とアイデアを出し実行する自分とを分けて考えることによって一つ目の原因を解消する。それなりの地位にある人間であればネット上での発言を管理する人間を雇うのもよいだろう。

もう一つの方法は当然二つ目の原因を解消することだ。これははてなの伊藤さんがTwitterを利用していないというのに該当する。そもそも利用しないことで「技術進歩」をなかったことにする(一つ目の対策の極端な場合と捉えることもできる)。

どちらにせよ、技術進歩が生み出した新しい問題に自分の状況に合った対応をすることが必要だ。自分が書く題材はアイデアが重要なのか、実行することが重要なのかを判断し、その上で自分をどの程度コントロールできるかを考える必要があるだろう(もちろん人を雇える場合はそれでもよい)。アイデアが重要なのであればどんどん公開すればよい。実行が重要なのに自分をコントロールできないなら利用しないのも手だ。

P.S. 長期的な利益を得る人間と行動する人間とかが異なる場合ではなく、同じ場合にこそ問題が生じるというのは面白い現象だ。多くの人間は自分の長期的利害と短期的な利害を調整するよりも、他人の長期的利害を調整するほうが得意なようだ。これは経済学的には不思議だが実感には一致するように思う。

オンライン数学コラボレーション

ブログでの議論が数学の論文が生まれたというニュースがUCLAの学生新聞The Daily Bruinから:

The Daily Bruin | UCLA mathematician Terence Tao’s site has audience of 40,000 via Environmental and Urban Economics

取り上げられているのはフィールズ賞まで受賞しているスター数学者であるテレンス・タオ(Terence Tao)のブログだ。

After six months and more than 1,000 comments from more than 50 mathematicians, a paper titled “A new proof of the density Hales-Jewett theorem” is ready to be submitted under the pseudonym D.H.J. Polymath because of the difficulty in determining how much each person has contributed. The paper is one of the first to be collaborated through a blog.

多くの数学者からのコメントをもとに完成した論文はD. H. J. Polymathという著者名のもとジャーナルに投稿されるそうだ。これはPolymathプロジェクトの一部だ(ポリマスとは博学なひとのことだ)。Polymathプロジェクトで扱われる問題はプロジェクトのブログで公開されている。

プロジェクト自体の構想についてはTim Gowersのポストに詳しい。このプロジェクトの鍵は次の問いにある:

What about the solving of a problem that does not naturally split up into a vast number of subtasks?

自然に分割できないような問題を解く場合に多くの人間が関わることの意味が何かということだ。これはインターネットという複数の人間が同時に作業をする環境が出現したことで生じた問題だ。彼は、この問いに肯定的な回答をする:

(i) Sometimes luck is needed to have the idea that solves a problem. If lots of people think about a problem, then just on probabilistic grounds there is more chance that one of them will have that bit of luck.

まず運という要素があるなら多くの人間が関与した方が望ましい。これは特許制度の設計でも重要だ。ある発明の価値が決まっていて、発明を試みる度に決まった確率で成功するとしよう。すると発明を試みる人間が多ければ多いほうが発明できる確率は上がっていく。

これが社会的に望ましいとは限らないことに注意が必要だ。社会的に望ましいのは発明の確率をできるだけ上げることではなく(何人が参加しても発明確率は100%にはならない)、試行のコストが限界的な試行の価値=発明の価値×発明確率のその試行による上昇分(marginal value)となった時だ。しかし、参加者は試行の費用が平均的な発明の価値=発明の価値×発明確率÷参加人数(inframarginal value)となった場合だ。この時、社会余剰はゼロになり、当然人数が過剰になっている。但し、発明の価値と発明者にとって私的利益は一致しないため必ずしも過剰にはならない。過剰になるか過少になるかは私的利益の割合によるが最適な値になる理由はない。

(ii) Furthermore, we don’t have to confine ourselves to a purely probabilistic argument: different people know different things, so the knowledge that a large group can bring to bear on a problem is significantly greater than the knowledge that one or two individuals will have.

二つ目の利点は分業だ。これについては異論はないだろう。異なる知識や強みをもつ人間の協力は生産性を上昇させる。

(iii) Different people have different characteristics when it comes to research. Some like to throw out ideas, others to criticize them, others to work out details, others to re-explain ideas in a different language, others to formulate different but related problems, others to step back from a big muddle of ideas and fashion some more coherent picture out of them, and so on.

三つ目の利点もまた分業の一種だが、研究の仕方に関するものだ。アイデアを出すのがうまいひともいれば、それを反駁するのが得意な人もいる。

ここから、

In short, if a large group of mathematicians could connect their brains efficiently, they could perhaps solve problems very efficiently as well.

数学者がうまく協力できれば問題を効率的に解いていけると結論付ける。

Why would anyone agree to share their ideas? Surely we work on problems in order to be able to publish solutions and get credit for them. And what if the big collaboration resulted in a very good idea? Isn’t there a danger that somebody would manage to use the idea to solve the problem and rush to (individual) publication?

次の課題は、ではどうやってうまく協力させるかというインセンティブの問題だ。

Here is where the beauty of blogs, wikis, forums etc. comes in: they are completely public, as is their entire history.

ここでブログやWiki、フォーラムの利点が指摘される。それは完全な公開性であり、証拠が残るという特性だ。

Instead of the usual reaction of being afraid to share it in case someone else beat you to the solution, you would be afraid not to share it in case someone beat you to that particular idea

アイデアを公開して他人に先に使われてしまうのを恐れるのではなく、早く共有することで誰かが先にそれを発表してしまうのを防げるという。

この問題も特許制度が抱えている問題と極めて類似している。特許は重要な発明が企業秘密にされてしまうことを防ぐという目的がある。特許があることで発明者は自分の発明を共有するインセンティブを持つ。インターネットは数学の問題を解く場合において部分的な貢献を公開・共有することを可能にした。これはジャーナルによる公開・共有が基本であった時代では不可能なことだ。

しかし、この方法がうまくいくかは数学におけるイノベーションの発生の方法に依存している。これは以前ふれた特許制度の問題とまったく同じだ。よってその弊害も同様に存在する:

  • 研究の途中で公開できるようになると最適な状態にたどり着く前に公開して終わりにしてしまうインセンティブがある
  • 細かい成果が公表されすぎると後続の研究がそれらを言及するための費用が増える

前者は以前のポストにおけるBoldrinとLevineの指摘を数学に適用したものだ。アイデアを得た人が本当なら最後まで頑張って仕上げたものを途中で公開してしまうということだ。これはいろんな学術分野に当てはまるだろう。

経済でいえばアイデアを出し、直感的な説明をするところはまでは楽しい。しかし、それを示す数理モデルを書いて、解いて、実証やシミュレーションを行うのは面倒だ。ジャーナルしか発表の場がなければそこまで頑張ってやるしかないが、ブログなどでさっさと世の中に公表できるなら最初のステップで終わりしてしまうかもしれない。誰かが後半をやっても前半部分は評価されるわけだ(前半のほうがセンスがいる)。Matthew Kahnは何故このような方法が経済でうまくいかないかと問いかけているがこれが答えだろう。経済学はアイデアと直感というセンスを要する部分が最も評価されるため後半を誰もやりたがらない。数学では重要な問題はいくらでもあって解くという後半のステップの比重が高い(そしてそれが好きな人が集まっている)。

後者は金銭支払いのない研究では大きな問題にはならないがそれでもややこしいことには変わらない。何かの定理を証明したとして既に誰かが発表している内容とかぶっていたらそれを引用する必要がある。もし、その定理に関する情報が学術ジャーナル以外の場所にも散在しているとなると、文献調査作業は非常に手間の掛かるものとなる。今までならその分野を研究している先生に聞いて、ジャーナルデータベースでも検索するだけだったが、そうもいかなくなるだろう。

ちなみにテレンス・タオは学術的に成功した天才児(Child Prodigy)としても有名だ。10歳で数学オリンピックに出場し銅メダル、13歳のときには現在に至るまでの最年少で金メダルをとっている。17歳で地元の大学(Flinders University)で修士号、20歳でプリンストン大学でPh.Dを取得し25歳には最年少でUCLAでテニュアを得ている。

http://rionaoki.net/2009/11/1464