۱۷
توصيه به ديگران
 
کد مطلب: 47955
یک رگرسیون گمراه‌کننده
تاریخ انتشار : يکشنبه ۳۱ خرداد ۱۳۸۸ ساعت ۱۲:۲۷




Statistical Report Purporting to Show Rigged Iranian Election Is Flawed


There is a statistical analysis making the rounds, however, which purports to show overwhelmingly persuasive evidence that the Iranian election was rigged. I do not find this evidence compelling.



Iran's election results were reported by its Interior Ministry in six waves. The first wave covered about one-third of the total vote; there were then two relatively large waves that reported about 20 percent of the vote each, and then three smaller waves that reported the remainder of the vote. What other observers have found is that, over the course of the six waves, there is an extremely strong, linear relationship between the number of votes reported for Ahmadinejad and the number reported for his principal opponent, Mir Hussein Moussavi (who had declared victory before any results were officially announced):



This relationship is superficially very impressive -- an R-squared of .998, which suggests a nearly perfect relationship.



Just how remarkable really is it, however? Rather than deal in abstractions, let's try a more concrete sort of experiment. Suppose that results from last November's election between Barack Obama and John McCain were revealed in this fashion, in six large waves. Suppose moreover that these waves were determined based on the alphabetical ordering of the states:



Wave 1: Results from Alabama-Illinois are reported; this represents about 33% of the total vote.

Wave 2: Results from Indiana-Mississippi (17% of the total vote) are added to the above totals.

Wave 3: Results from Missouri-North Carolina (19%) are added.

Wave 4: Results from North Dakota-Pennsylvania (12%) are added.

Wave 5: Results from Rhode Island-Texas (10%) are added.

Wave 6: Lastly, results from Utah-Wyoming (9%) are added and the counting is complete.



If results were released in this fashion, here is what we would get for the total number of votes for Obama and McCain at each stage:



Now, let's plot these on a graph:



Wow! The correlation is extremely high -- an R-Squared of .9959 -- almost as high as the one we saw for Iran. Does that mean the U.S. election was rigged too?



Of course not. The apparently extremely strong relationship is mostly an artifact of the exceptionally simple fact that as you count more votes, both candidates' totals will tend to increase. In our example, Wave 5 happens to be a very good one for McCain: it contains the results from South Carolina, South Dakota, Tennessee and Texas -- four red states -- plus Rhode Island, which went for Obama but contains a tiny number of votes. And yet, the impact of Wave 5 is barely visible when the results are presented in this fashion.



Likewise, there was more wave-to-wave variation in the Ahmadinejad-Moosavi results than the statistical analysis I cited above seems to imply. Ignoring votes for minor candidates, Ahmadinejad won a high of 70.4 percent of the votes in Wave 1, and a low of 62.3 percent in the votes newly added in Wave 6. By comparison, Obama's share of the newly-added votes in our experiment ranged from 56.4 percent in Wave 3 to 44.7 percent in Wave 4. That's slightly more variance than we saw in the Iranian results but not much.





Source:

http://www.fivethirtyeight.com
ترجمه
تحلیل‌های آماری مبنی بر تقلب در انتخابات ایران معیوب است




تحلیلی آماری ارایه شده است که از آن به عنوان مدرک تقلب در انتخابات ایران یاد می‌شود. این تحلیل قانع‌کننده نیست.



نتایج انتخابات توسط وزارت کشور ایران در شش زمان جداگانه اعلام شد. اولین بار اعلام، تقریبا یک سوم کل آرا را شامل می‌شد. بعد از آن دو بار اعلام نتایج انتخابات داشتیم که هر کدام تقریبا 20 درصد آرا را شامل می‌شدند و سرانجام سه بار اعلام نتایج دیگر داشتیم که باقیمانده آرای شمارش شده را شامل می‌شدند. بنابر تحلیل‌ها، وجود رابطه خطی قوی میان آرای احمدی نژاد و رقیب اصلی او موسوی ( که قبل از انتخابات پیروزی خود را اعلام کرده بود) نشانگر تقلب در انتخابات ایران است.
 
 






ضریب رگرسیونی بالا (R2 = 0.998) نشان‌دهنده یک رابطه تقریبا کامل است.



این مساله تا چه اندازه واقعا قابل توجه است. اجازه بدهید بر تجاربمان متمرکز شویم. فرض کنید که نتایج انتخابات نوامبر ایالات متحده بین باراک اوباما و جان مک‌کین به همان ترتیب انتخابات ایران در شش مرتبه اعلام شود. فرض کنید که این نتایج به ترتیب الفبایی ایالت‌های مختلف اعلام شود.



دفعه اول: نتایج آلاباما تا ایلینوی گزارش می‌شود. این مرحله 33 درصد آرا را شامل می‌شود.

دفعه دوم: نتایج ایندیانا تا میسیسیپی اعلام می‌شود. 17 درصد دیگر

دفعه دوم: نتایج میسوری تا کارولینای شمالی اعلام می‌شود. 19 درصد دیگر

دفعه دوم: نتایج داکوتای شمالی تا پنسیلوانیا اعلام می‌شود. 10 درصد دیگر

دفعه دوم: نتایج یوتا تا ویومینگ اعلام می‌شود. 9 درصد باقیمانده



اگر نتایج به این ترتیب اعلام شود، شکل زیر را برای کل آرای رقابت اوباما - مک کین خواهیم داشت. R2 = 0.996
 






آیا این نشان می‌دهد که در انتخابات ایالات متحده تقلب صورت گرفته است؟



البته که نه. این رابطه ظاهرا قوی تنها به خاطر این واقعیت ساده است که هرچه قدر رای های بیشتری شمرده می‌شود،  جمع کل آرای دو نامزد هم افزایش می‌یابد. در مثال ما، در بار پنجم اعلام آرا که یک نتیجه خیلی خوب برای مک کین است و آرای کمی به اوباما تعلق گرفته است، این مرحله در نمودار به چشم نمی‌آید.



به همین ترتیب در مورد واریانس اعلام نتایج از یک دفعه به دفعه دیگر نیز می‌توان به صورت بالا اعلام نظر کرد. با چشم پوشی از آرای نامزدهای دارای آرای کم، آرای احمدی نژاد در بار اول 70.4 و در بار ششم، 62.3 درصد بوده است. اگر با مورد امریکا مقایسه کنیم،  آرای اوباما در دفعه سوم اعلام نتایج، 56.4 درصد و در دفعه چهارم 44.7 درصد بوده است که البته اندکی از واریانس نتایج ایران بیشتر بوده است.
 
مرتبط

A Misleading Curve - منحنی گمراه‌کننده

انحراف معیار آرای اعلام شده مشکل دار بود؟



 
 
Share/Save/Bookmark
 


Spring
۱۳۸۸-۰۳-۳۱ ۱۴:۱۰:۰۸
The other probabilty is that the had been also a fraud in Obama\'s election (157344)
 
مجيد
۱۳۸۸-۰۳-۳۱ ۱۴:۱۱:۳۰
با سلام و تشكر
جالب بود بوي‍ژه مقايسه صورت پذيرفته با انتخابات آمريكا و جمعبندي نهايي ارائه شده در پايان متن و اينكه با يك نمودار نبايد جوگير شد (157350)
 
ناشناس
۱۳۸۸-۰۳-۳۱ ۱۶:۰۴:۴۲
ما دو نامزد دیگه هم داریم، لطفا اونها هم تو محاسباتتون شرکت بدید. (157619)
 
مرتضي
۱۳۸۸-۰۳-۳۱ ۱۹:۵۱:۵۱
با سلام
مقايسه دو نمودار همچنانكه همه نظر دهنده ها در آن سايت اتفاق نظر دارند درست به نظر نميرسد. صرفنظر از نحوه متفاوت برگذاري انتخابات در دوكشور، در نمودار آمريكا نقاط بر حسب ايالتها آنهم به ترتيب الفبا مشخص شده و نمودار در ايران بر حسب اعلام وزارت كشور در بازه هاي مختلف زماني كه معلوم نيست شامل مجموع آراي كدام مناطق بوده مشخص گرديده است. احتمال ثابت بودن نسبت آرا با توجه به اينكه احتمالا ابتدا آراي روستاها و شهر هاي كوچك تجميع شده و سپس آراي شهرهاي بزرگ مشكوك ميباشد. ضمنا وزارت كشور با اعلام عجولانه و نوآورانه آرا عمدا يا سهوا شبهه هاي زيادي را ايجاد كرده است.در ضمن اگر تحليل هاي آن منبع مورد تاييد شماست لطفا تحليلهاي ديگري را كه نتايج انتخابات را زير سوال مي برد در سايت خود بياوريد. با تشكر (157947)
 
.
۱۳۸۸-۰۳-۳۱ ۲۰:۳۰:۳۷
عزیز برادر این تحلیل اشکال دارد. اگر شما بیاید بر اساس آن درصد که میگویید مرحله اول 33 درصد بعد 17 درصد و... نتایج هر مرحله را از ضرب درصد در ارای کل به دست آورید و نمودار رسم کنید که معلوم است خطی می شود. باید رای هر دو نامزد در هر مرحله را بدهید بعد ما رسم کنیم ببینیم که آره خطی شد یا نشد. آرای هر مرحله را با ذکر منبع در سایت های رسم آمریکا بدهید لطفا.
در ضمن گفتم که نمودار اول 7 نقطه است نه 6 نقطه! (157995)
 
صاد
۱۳۸۸-۰۳-۳۱ ۲۰:۴۲:۲۲
در این استدلال مغلطه ی واضحی شده است. بحث این نیست که هرگز امکان خطی بودن نتایج وجود ندارد ؛ در انتخابات آمریکا در هر مرحله نتایج در ایالت های مختلفی که در بعضی غلبه با دموکرات ها و در بعضی غلبه با جمهوری خواه ها بود اعلام می شد در نتیجه آرایش آرا در یک سری ایالت (که نتایجشان در یک مرحله اعلام می شد) مشابه نتایج کلی جامعه بود.
اما در انتخابات ایران اصلا اینگونه نیست؛ آرای اعلام شده در مراحل مختلف به علت اینکه آرای مراحل ابتدایی مربوط به مناطق روستایی و شهر های کوچک بود،غلبه به شدت با آقای احمدی نژاد بوده ولی آیا همین آرایش آرا در کلان شهرها هم وجود دارد. بدیهی است همانگونه که سایت الف هم به آن تصریح کرده است در کلان شهرها که آرای آن در مراحل پایانی شمارش اعلام شد غلبه با آقای موسوی بوده است لذا شیب خط در نمودار اول باید افزایش می یافت. (158008)
 
mmj
۱۳۸۸-۰۳-۳۱ ۲۲:۵۶:۱۵
دست مریزاد همه باید برای جلوگیری از گسترش اشوب کمک کنند که انوقت بضرر همه است (158128)
 
تحیر
۱۳۸۸-۰۴-۰۱ ۰۹:۰۹:۰۴
هرکسی از ذن خود شد یار من. متاسفانه هرکسی با نگرش خود آمار را می بیند و تحلیل می کند، آیا کسی هست که بر اساس اصول علمی و با فرضیه بدون لحاظ کردن نظر شخصی آمار را تحلیل کند؟ (158463)
 
برزگر
۱۳۸۸-۰۴-۰۱ ۱۱:۴۵:۲۴
نویسنده مفاله نتایج انتخابات آمریکا را بر حسب حروف الفبای ایالتها و نه زمان واقعی اعلام نتایج، اورده است که یک مغلطه به نظر می رسد. (158746)
 
۱۳۸۸-۰۴-۰۱ ۱۱:۴۶:۳۲
این سایت خبری است یا سایت محاسبات آماری پیچیده؟
ما اشتباه اومدیم یا شما اشتباه می نویسید؟
فکر نمی کنید دیگه کافیه؟
ما مردم بی سواد، بی ادب و بی نزاکت فقط اینو می فهمیم:
20% بیشتر از دوره های قبل رای دادن یعنی کسانی که تا حالا رای ندادن این بار رای دادن
آیا ممکن است آنها به احمدی نژاد رای داده باشن؟

آیا کسی که هرگز رای نداده اینبار به احمدی نژاد رای داده؟

واضح است که نه

پس رای آنها کجا رفته؟

جواب بدید (158750)
 
۱۳۸۸-۰۴-۰۲ ۰۱:۱۰:۳۴
یه چیزو شما نمی دونین خیلی ها از نگرانی که نکنه آقای موسوی رای بیاره اومدن به اقای احمدی نژاد رای دادن , خیلی از این ها بار اولشون بود که در عمرشون رای می دادن اما اومدن که آقای احمدی نژاد تایید بشه (159730)
 
جواد
۱۳۸۸-۰۴-۰۴ ۰۲:۳۲:۰۹
نباید فکرکرد هرکی به احمدی نژاد رای داد مثل خودش انقلابی دو آتیشه هستند .
خیلی ها که هیچ وقت رای نمیدادن وصبح تاشب باحرفهای غلط ودرستشون بالا تا پایین مملکت رو به فحش میکشیدن ازبعضی حرفهای احمدی نژاد خوششون اومده.
نمیگم حرفای اون درسته یا اینکه بهترینه.اصلا وابدا. اما فکر میکنم رایهاش مال خودشه یا بهتر بگم از لج برخی از انقلابیونه. (163429)
 
حبیب
۱۳۸۸-۰۴-۰۱ ۱۴:۵۷:۰۸
متن بسیار جالب و تکان دهنده ای است.
جالب تر اینکه یکی از مصادیق تقلبی که آقای موسوی به شورای نگهبان اعلام نمودند همین نمودار خطی ارای دو کاندیدا می باشد.
مناظرات انتخاباتی را به خوبی به خاطر می آورم که آقای موسوی چگونه نمودار های آقای احمدی نژاد به مار خوش خط وخال و... تمثیل کردند! بارها احمدی نژاد را دروغگو خطاب کردند! ....
اما اینک جناب آقای موسوی
به خوبی دریافتم که نمودار ساز کیست
چگونه با اعداد می شود بازی کرد
چگونه می توان مشتی جماعت را گول زد
آن همه هیجان در آن جلسات برای چه بود

جناب آقای موسوی ضرب المثل زیبایی است که می گوید:
> (159125)
 
حبیب
۱۳۸۸-۰۴-۰۱ ۱۵:۰۰:۱۱
متن بسیار جالب و تکان دهنده ای است.
جالب تر اینکه یکی از مصادیق تقلبی که آقای موسوی به شورای نگهبان اعلام نمودند همین نمودار خطی ارای دو کاندیدا می باشد.
مناظرات انتخاباتی را به خوبی به خاطر می آورم که آقای موسوی چگونه نمودار های آقای احمدی نژاد به مار خوش خط وخال و... تمثیل کردند! بارها احمدی نژاد را دروغگو خطاب کردند! ....
اما اینک جناب آقای موسوی
به خوبی دریافتم که نمودار ساز کیست
چگونه با اعداد می شود بازی کرد
چگونه می توان مشتی جماعت را گول زد
آن همه هیجان در آن جلسات برای چه بود

جناب آقای موسوی ضرب المثل زیبایی است که می گوید:
> (159133)
 
۱۳۸۸-۰۴-۰۱ ۱۵:۴۶:۰۵
سوال من اينجاست كه اين بحثهاي آكادميك و علمي در سايت شما چرا بعد از 10 روز مد شده ؟ واقعا\" فكر نميكنيد كه دير شده و آب رفته رو به جوي نميتوان بازگرداند؟ (159236)
 
حاج حبیب
۱۳۸۸-۰۴-۰۵ ۰۸:۵۸:۴۹
سایت الف مردانه بگوید که اگر یک مرکز علمی در آمریکا می آمد و یک تحلیل علمی ارائه می کرد که نتیجه اش تأیید تقلب در انتخابات ایران بود؟ عوان و انصار رئیس جمهور سابق نمی گفتند که این یک مرکز صهیونیستی است که به او پول داداد ه شده تا اصلاح طلبان مزدور از خدا بی خبر و وطن فروش را تأیید کند و این گزارش ها برای مانند کاغذ پاره است و هیچ ارزشی ندارد ؟
(البته فکر نمی کنم چاپ کنید ولی می نویسم که حداقل یک نفر از شماها این را بخواند) (164394)
 
مسعود
۱۳۸۸-۰۴-۱۵ ۲۳:۰۵:۱۱
چرا شما که قصد انعکاص نظرات درست و حسابی را ندارید تظاهر به این امر میکنید؟

من چند روز پیش یک تحلیل کامل ریاضی روی این مقاله کردم چرا منعکس نکردید ؟

مسعود دهدار (176011)