データは計測したら使う

データ収集の悩みその2です。

今回は「データは集めているけれど、データの精度が悪くて使えないんだよね」という悩みにお答えしたいと思います。私の回答は「データの精度が悪くても分析に使う、とにかく使う」です。

データ精度の向上は、どこまで行ってもついて回る問題です。自分たちから見たら、はるかにきちんとできているように見える組織でも、何らかのデータ精度の悩みは持っています。なので、データ精度はこだわってもいいですが、ほどほどにしておくことです。

それよりそのデータを使うことに集中しましょう。例えば、自分達が1か月にどのくらいの規模を開発しているのか、それに工数はどのくらいかかっているのか、バグは何件くらい摘出しているのか、その結果、お客様で何件のバグが検出されているのか、といったことを集計してみるのです。それだけでも、ふーん、そうなのか、と何か考えるはずです。思ったより多い、とか思ったより少ない、という感想を持つはずです。試しにまわりの方へ見せてみてください。これだけでも、何か意見のある方が出てくるはずです。

次はその毎月の推移を示すのです。毎月同じデータ項目を集計すれば、自然とその推移もわかります。それをグラフにすればよいだけです。上がったり下がったりしているはずです。今月は開発規模が大きく上がった、なぜだろう? 調べてみたら、コメント行を含めているものと、含めていないものが混在していて、たまたま今月はコメント行を含めて計測したものばかりだったから、いつもより規模が多くなったんだ、といった具合に原因がわかるわけです。そうすれば、では来月からは、コメント行は含めないで(あるいは含めて)カウントしよう、というように取り決めようとするのではないでしょうか。もしかしたら、規模を計測するツールを決めて全員がそれを使う、となるかもしれません。

こうして、データ定義が詳細化されて、データ精度が少しずつ向上していきます。データを使うから、何か問題がわかって、それを解決するためにデータ定義を詳細化して、そしてデータ精度が向上する、この繰り返しです。逆のサイクルではありません。なぜなら、せっかく計測しようと思ったのに、データ定義がこうだからこう測って、と細かく言われたら、計測する気がなくなりませんか? まずは測ってみる、そうしたら何か思っていたのと違っていた、考えてみたら測り方が少し違っていたから測りなおしてみた、なるほど思った通りだった、そういう繰り返しなのです。

データ精度が悪かったら、正しく把握できないのだから、そんなデータを使っても意味がないと思うかもしれません。でも、データ精度はどの時点でも同程度の誤差でしょうから、その誤差の範囲の中での上下の変化は信用できると思います。微妙な変化はわからないかもしれませんが、大きな変化はわかるということです。まずは大きな変化を把握することから始めればよいのです。

「データは計測したら使う」が基本です。使うからデータ精度が向上します。ぜひお試しください。