نظر منتشر شده
۲
توصيه به ديگران
 
کد مطلب: 48057
و باز هم بنفورد
تاریخ انتشار : دوشنبه ۱ تير ۱۳۸۸ ساعت ۱۱:۰۷
چند روز پیش، به دنبال انتشار نتایج انتخابات ریاست جمهوری به تفکیک شهرستان ها، سایت خبرگزاری "انتخاب" مطلبی تحت عنوان "مستندات علمی دستکاری در آراء انتخابات دهمین دوره انتخابات" منتشر کرد.* در این مطلب، این گونه ذکر شده بود که "این مطلب اختصاصا در انتخاب برای آگاهی شورای محترم نگهبان و نامزدهای دهمین دوره انتخابات ریاست جمهوری درج می گردد و مستنداتی ارائه می دهد که قابل پیگیری در علم آمار است". این مطلب در ابتدا به نظرم جالب توجه آمد، اما پس از خواندن دقیق تر آن و بحث با دوستان، متوجه شدم که نویسنده متأسفانه مرتکب برخی خطاهای مهم شده که صحت این تحلیل علمی را به کل زیر سوال می برد و در نتیجه، با این استدلال نمی توان شواهد آشکاری در اثبات تقلب ارائه نمود.

در این مطلب، به قانونی به نام قانون بن فورد اشاره می شود و توضیح داده می شود که بر پایه این قانون، که "همانند قوانین نیوتن یک واقعیت علمی است"، قواعدی برای فراوانی ارقام یک مجموعه از داده های واقعی وجود دارد. و در توضیح این قواعد، اینگونه می نویسد: "احتمال اینکه آخرین عدد سمت چپ یک عدد (فرض کنید تعداد آراء اخذ شده به نفع یک کاندیدا) که میتواند یکی از اعداد 1 تا 9 باشد با هم برابر نیست. بلکه احتمال آنکه رقم سمت چپ یک عدد، 1 باشد حدود 30% است در حالی که این احتمال برای عدد 9 در حدود 4.5%. همچنین است احتمال وجود عدد 0 تا 9 برای دومین رقم سمت چپ تعداد آراء اخذ شده به نفع یک کاندیدا. بسیاری از منابع علمی دومین رقم سمت چپ تعداد آراء اخذ شده به نفع یک کاندیدا در یک شهرستان را بعنوان معیار اندازه گیری تقلب در انتخابات تعیین میکنند و به آن 2nd digit Benford’s Law می گویند و دلیل آن این است که اگر تقلب بوسیله نرم افزارهای شبیه سازی انجام شده است امکان دارد که رقم اول با قانون بن فورد همخوانی داشته باشد اما امکان دستکاری آرا و هماهنگ کردن آن با دومین رقم سمت چپ فراهم نیست".

پس از آن، در جدول شماره دو، داده های مربوط به دومین رقم به تفکیک هر یک از نامزد ها منتشر گردیده، و با عددهای مورد انتظار برای هر یک از ارقام مقایسه شده است:
 


و در نهایت، با انجام آزمون مربع کای (یک آزمون آماری برای مقایسه اعداد مشاهده شده و اعداد مورد انتظار)، و محاسبه پی مقدار، به جدول زیر رسیده است:


و نتیجه گرفته است که احتمال دستکاری آرا، در مورد تمامی کاندیداها، چیزی نزدیک به صد در صد است.
 
اکنون بیایید صحت برخی ادعاهای ارائه شده در این مطلب را مورد بررسی قرار دهیم، و فرض کنیم قانون بن فورد در اینجا برقرار است **.

ادعای نخست: داده های مشاهده شده در مورد ارقام، و اعداد مورد انتظار در مورد این ارقام، مطابق جدول دو در متن فوق الذکر است. برای بررسی این ادعا می توان وقت بیشتری صرف نمود و همه ارقام را مجدداً شمرد. من این کار را انجام ندادم و به داده های ارائه شده اعتماد کردم. اما در مورد تعداد رقم های مورد انتظار، با یک اشتباه آشکار مواجه هستیم: انتظار داریم تعداد رقم های "2" که در 366 شهر مشاهده می شود، برابر با 9/10% (ده و نه دهم درصد ***) از کل موارد، یعنی حدود 40 مورد باشد، در حالی که این عدد، در جدول دو به اشتباه (؟) مساوی 73 درج گردیده است (و این اشتباه در ستونهای مربوط به هر چهار کاندیدا تکرار شده است).

ادعای دوم: بر اساس آزمون مربع کای، داده های مشاهده شده، با اعداد مورد انتظار به طرز معنی داری تفاوت دارند (که این نتیجه در مقادیر بسیار کوچک پی مقدار در جدول 3 منعکس شده است). برای بررسی این ادعا، با توجه به وجود یک داده اشتباه (یعنی 73 به جای 40)، باید مقادیر مربع کای (و همین طور پی مقدارها) را مجدداً محاسبه کنیم. نتیجه تکرار این محاسبات بر اساس آزمون مربع کای  به صورت زیر خواهد بود:



به این ترتیب مشاهده می شود که پی مقدارها در این آزمون اعداد نسبتاً بزرگی هستند، و فرضیه "انحراف اعداد از توزیع انتظاری بن فورد" تایید نمی شود.

ادعای سوم (که البته به صورت غیرآشکار و فقط در جدول 3 قابل مشاهده است): احتمال دستکاری آرا برابر است با 1 منهای پی مقدار. نادرستی این ادعا برای افرادی که با علم آمار آشنایی دارند واضح است. چون این موضوع احتمالاً مورد علاقه عموم مخاطبان نیست، از توضیح بیشتر در این باره صرف نظر می کنیم.

به این ترتیب، با فرض برقراری قانون بن فورد و انجام آزمون مربع کای روی داده های مشاهده شده، نمی توان بروز تقلب را در انتخابات اخیر اثبات نمود.

ا. مرعشی

دانشجوی دکترا، برلین



* این مطلب در آدرس اینترنتی زیر قابل مشاهده است:

http://www.entekhabnews.us/portal/index.php?news=6435

** در مطلب فوق الذکر، ادعا شده که قانون بن فورد، همانند قوانین نیوتن، یک واقعیت علمی است. این ادعا کاملاً صحیح است، اما نیاز به توضیح دارد. قوانین نیوتن، در شرایط خاصی (مثلاً در مورد اجسامی که با سرعت های معمولی حرکت می کنند) برقرار هستند. اما در صورتی که شرایط اشیاء تغییر کند، مثلاً وارد دنیای ذراتی شویم که با سرعت های نزدیک به سرعت نور حرکت می کنند، تمامی قوانین نیوتن زیر سوال می روند و مثلاً قوانین نسبیت انیشتین برقرار خواهند بود. در اینجا نیز با حقیقتی مشابه مواجه هستیم: قانون بن فورد در شرایطی که داده ها به صورت تصادفی توزیع شده باشند برقرار هستند. اما باید توجه کرد که داده های مورد استفاده در اینجا به صورت تصادفی توزیع نشده اند، مثلاً جمعیت هیچ یک از شهرستانهای کشور ممکن نیست صفر باشد، و جمعیت هر یک از شهرهای ایران، حتماً از یک عدد خاص، مثل ده هزار بزرگتر است. به این ترتیب، نمی توان به طور قطع گفت در اینجا هم حتماً قانون بن فورد باید برقرار باشد. برای اطلاع بیشتر، به صفحه ویکی پدیای مربوط به قانون بن فورد مراجعه کنید:

http://en.wikipedia.org/wiki/Benford's_law

*** این احتمال به طریق زیر قابل محاسبه است:

برای اطلاع بیشتر، به صفحه ویکی پدیای مربوط به قانون بن فورد مراجعه کنید:

http://en.wikipedia.org/wiki/Benford's_law

یا مقاله زیر را ملاحظه کنید:

http://people.math.gatech.edu/~hill/publications/BENFORD%20PAPERS/sigDigitPhenomenon1995.pdf

 
 
چشم شوم
۱۳۸۸-۰۴-۰۱ ۱۱:۴۰:۲۳
ای که گفتی یعنی چه (158729)
 
ميثم
۱۳۸۸-۰۴-۰۱ ۱۴:۵۱:۴۵
از قضا سركنگبين صفرا فزود. (159114)
 


نظراتی كه به تعميق و گسترش بحث كمك كنند، پس از مدت كوتاهی در معرض ملاحظه و قضاوت ديگر بينندگان قرار مي گيرد. نظرات حاوی توهين، افترا، تهمت و نيش به ديگران منتشر نمی شود.