ما چگونه بدترین مکان برای پارک خودرو را در شهر نیویورک پیدا میکنیم — با استفاده از دادههای بزرگ
متن سخنرانی :
۹٫۴۰۰ کیلومتر جاده . ۹۴۰ کیلومتر مسیر زیرزمینی مترو، ۶۴۰ کیلومتر مسیر دوچرخه سواری و ۸۰۰ مسیر تراموا، اگر شما تابحال به جزیره روزولت رفته باشید را خواهید دید.اینها اعدادی هستند که زیرساخت های شهر نیویورک را تشکیل می دهند. اینها آماری از زیرساخت های شهر ما است. اینها اعداد و ارقامی هستند که درگزارشهای آژانسهای شهری منتشر میشوند به عنوان مثال، وزارت حمل و نقل احتمالا به شما خواهد گفت که چند کیلومتر از جاده را نگهداری میکنند. مقامات حمل و نقل شهری، از اینکه چندین مایل مسیر زیرزمینی مترو وجود دارد، به خود میبالند بیشتر سازمانهای شهری به ما آمار میدهند. این گزارشی از سال جاری است از نمایندگی تاکسیها و لیموزینها، از آن متوجه میشویم که تقریبا ۱۳٫۵۰۰ تاکسی در شهر نیویورک وجود دارد. بسیار جالب توجه است، درسته ؟ اما آیا شما تا به حال فکر کردهاید که این اعداد از کجا آمدهاند ؟ از آنجا که این اعداد باید وجود داشته باشند،فردی در آژانسهای شهری باید بایستد و بگوید، اینجا اعدادی هست که ممکن است کسی بخواهد بداند. در اینجا اعدادی هستندکه شهروندان ما می خواهند بدانند. بنابراین به دادههای خام خود رجوع کردند، آنها شمارش کردند، جمع زدند ، آنها محاسبه کردند، و سپس گزارشهایی را ارائه دادند، و آن گزارشها اعدادی مانند این هستند.
مشکل این است که، آنها چگونه تمام پرسش های ما را می دانند؟ ما سوالات زیادی داریم. در واقع، میتوان اینطور برداشت کرد کهسوالات بی پایانی وجود دارد که ما می توانیم در مورد شهرمان بپرسیم. سازمانها هرگز نمی توانند این موضوع را تحمل کنند. بنابراین الگو به طور دقیق کار نمیکند،و من فکر میکنم سیاستگذاران ما متوجه آن هستند ، زیرا در سال ۲۰۱۲، شهردار بلومبرگقانونی را به امضا رسانید که بلند پروازانهترین و جامعترین قانون داده باز در کشور نام گرفت از بسیاری از جهتها او درست میگفت. در دو سال گذشته،این شهر ۱٫۰۰۰ مجموعه داده منتشر کرده اند در پورتال داده باز شهر، و این بسیار عالی است. بنابراین شما تنها به دادههایی شبیه این نگاه میکنید، و به جای آنکه فقط تاکسیها را بشماریم ، می توانیم سوالات متفاوتی بپرسیم.
پس من یک سوال دارم. ساعت شلوغی در شهر نیویورک چه موقعی است؟ و این می تواند بسیار مشکل ساز باشد.ساعت شلوغی دقیقا چه موقعی است؟ و من با خودم فکر میکردم،این تاکسیها فقط اعداد نیستند، اینها دستگاههای ضبط GPS میباشندکه در اطراف خیابانهای شهر ما رانندگی میکنند هر سواری که آنها انجام میدهند ضبط میکنند. این دادهها در آنجا وجود دارند،و من به آنها نگاه میکنم، طرحی از سرعت متوسط تاکسیها در شهر نیویورکدر طول روز درنظر را میگیرم. شما می توانید ببینید که از حدود نیمه شب تاحدود ۵:۱۸ صبح، سرعت افزایش میابد، و در آن موقع،همه چیز تغییر میکند، و آنها کندتر و کندتر و کندتر میشوندتا حدود ۸:۳۵ صبح، زمانی که آنها در حدود سرعتیازدهونیم مایل در ساعت متوقف میشوند متوسط تاکسی که یازدهونیم مایل در ساعت در خیابانهای شهر تردرد میکنند، و روشن میشود که آنها به همین وضع باقی میمانند برای تمام روز. (خنده حضار) بنابراین به خودم گفتم، حدس می زنمهیچ ساعت شلوغی در شهر نیویورک وجود ندارد. بلکه یک روز شلوغی وجود دارد. حس میکنید. و این به دو دلیل مهم است. اگر شما یک برنامه ریز حمل و نقل هستید،بسیار جالب است که بدانید. اما اگر شما میخواهید به سرعت به جایی بروید، میدانید که هشدار ساعت خود را برای ۰۴:۴۵ صبح تنظیم کنید و البته همهی شما این کار را انجام میدهید. نیویورکیها، درسته ؟
اما پشت این دادهها داستانی وجود دارد. اگر این دادهها در دسترس نبودندآن وقت روشن میشد. در واقع این از چیزی به نامقانون آزادی اطلاعات به دست میآید و یا یک تقاضای FOIL. این فرمی است که میتوانید دروب سایت نمایندگی تاکسی و لیموزینها پیدا کنید . به منظور دسترسی به این دادهها،شما نیاز به دریافت این فرم دارید، آن را پر کنید، و آنها شما را مطلع میکنند، مردی به نام کریس وانگاین کار را دقیقا انجام داد. کریس رفت، و آنها به او گفتند، "فقط کافی است تا با یک برند جدید هارد دیسک به دفتر ما بیایی، آن را را برای پنج ساعت در اینجا بگذاری،ما دادهها را کپی میکنیم و آن را به شما برمیگردانیم. " و این جایی است که این دادهها از آنجا آمده اند خوب، کریس از آن دسته افرادی است که می خواهد اطلاعات در دسترس عموم باشد، پس آن دادهها را آنلاین قرار داد تا همه استفاده کنند،وبه همین دلیل است که این نمودار ها پدید آمدهاند. و واقعیت شگفتانگیز این است کهدستگاههای ضبط GPS (سامانه موقعیتیاب جهانی)- واقعا خوب کار میکنند. این واقعیت است که شهروندانی داریمکه با هارددیسک هایی در اطرف ما حرکت میکنند و داده ها را از آژانسهای شهری جمع کردهتا آن را به عموم مردم برسانند- این دادهها به نوع عمومی بودند ،شما می توانستید آنها را دریافت کنید، اما هرچند"دردسترس" بود ولی عمومی نبود. به عنوان یک شهر می توانیم بهتر از آن را انجام دهیم. ما نیاز نداریم تا شهروندانماندر اطراف با هارد دیسکهایی راه بروند
اکنون،در پشت تقاضای فویل هر مجموعه دادهای نمی باشد. این نقشه ای است که در مورد خطرناکترین تقاطعها در شهر نیویورک تهیه کرده ام. بر اساس حوادث دوچرخه سواری. پس، نواحی قرمز رنگ خطرناک تر می باشند. و آنچه که در نگاه اول نشان میدهد بخش شرقی منهتن است، به خصوص در مناطق پایین تر منهتن،حوادث دوچرخه سواری بیشتر است. که ممکن است با معنی باشد زیرا دوچرخه سواران بیشتریاز پلهای آنجا پایین میآیند . اما نقاط دیگر نیز، ارزش آن را دارند که بررسی شوند. اینجا ویلیامزبرگ است.اینجا خیابان روزولت در کویینز است. و این دقیقا همان نوع داده ای است که ما برای پروژه دید صفر نیاز داریم. این دقیقا همان چیزی است که به دنبال آن هستیم.
اما پشت این داده ها نیز، داستانی وجود دارد. این دادهها همینطوری ظاهر نمیشوند. چند نفر از شما این لوگو را میشناسید؟ بله، من حرکتهایی را میبینم. آیا شما تاکنون برای کپی کردنو چسباندن داده از فایلهای پیدیاف تلاش کردهاید و این را حس کردهاید؟ من حرکتهایی بیشتری را میبینم. بیشتر شما تلاشی بری کپی کردن و چسباندن دادهها انجام دادهایدپس این لوگو را میشناسید. من آن را دوست دارم.
پس آنچه اتفاق میافتد این است که آن دادهها به صورت پیدیاف بودند. در واقع، صدها و صدها و صدها صفحه پیدیاف که توسط ادارهٔ پلیس نیویورک قرار داده شده اند ، و به منظور دسترسی به آن،شما یا مجبور به کپی و چسباندن دادهها هستید برای صدها و صدها ساعت، و یا آنکه شما می توانید جان کراس باشید. جان کراوس شبیه به این بود، من نمیخواهم دادهها را کپی کنم و بچسبانم.من میخواهم یک برنامه بنویسم. که کمک رسان سقوط باند دادههای انوایپیدی نام گرفت ، و این برنامه به وب سایت انوایپیدی می رودو فایلهای پیدیاف را دریافت میکند. هر روز آن را جستجو میکند.و اگر پیدیاف را پیدا کند، آن را دریافت میکند. و سپس نوعی برنامه تبدیل پیدیاف را اجرا میکند که خروجی آن فایل متنی است و آن را بر روی اینترنت قرار میدهد و سپس مردم می توانند نقشههایی مانند آن را پیدا کنند. این واقعیت که دادهها در اینجا هستند،واین که ما به آنها دسترسی داریم - هر رویدادی، یک ردیف در این جدول است. شما می توانید تصور کنید که چقدرفایل پیدیاف خواهد بود. این واقعیت که مابه آن دسترسی داریم بسیار عالی است، اما اجازه دهید آن را در فرم پیدیاف ایجاد نکنیم ، چرا که پس از آن ما شهروندانمان را داریم کهمبدلهای پیدیاف را مینویسند. البته این بهترین استفاده اززمان شهروندانمان نیست، و ما به عنوان یک شهر میتوانیم کار بهتری انجام دهیم.
در حال حاضر، خبر خوب این است کهدولت بلاسیو به تازگی این دادهها را در چند ماه گذشته منتشرکرده است پس اکنون ما میتوانیمبه آین دادهها دسترسی داشته باشیم، اما دادههای بسیاری وجود دارند که هنوز در پیدیاف ها مدفون هستند. به عنوان مثال، دادههای مربوط به جرم و جنایت هنوز هم تنها فقط یه صورت پیدیاف در دسترس است. و نه فقط دادههای جرم و جنایت،بلکه بودجه شهر هم همینطور در حال حاضر بودجه شهر ما فقط در فرم پیدیاف قابل خواندن است. و فقط ما نیستیم که نمیتوانیم این دادهها را تحلیل کنیم -- حتی قانون گذاران ماکه برای بودجه رای میدهند فقط آن را به صورت پیدیاف دریافت میکنند. بنابراین قانونگذاران ما هم نمیتوانند بودجهای که به آن رای دادند را تجزیه و تحلیل کنند. و فکر می کنم به عنوان یک شهر،کمی بهتر از آنچه اکنون هست را می توانیم انجام دهیم .
در حال حاضر، دادههای بسیاری وجود داردکه در فایلهای پیدیاف پنهان نیستند. این نمونهای از نقشهای است که من ساختهام و این کثیفترین آبراه در شهر نیویورک است. اکنون، چگونه میزان کثیفی را اندازه میگیریم؟ خوب، اندکی عجیب و غریب است، اما برای آن، به سطح کلیفرم ته نشین شده نگاه کردم که معیار اندازهگیری تهنشینی در هر یک از آبراهههای شهر است. به همان اندازه که دایره بزرگتر استآلودگی هم بیشتر است، بنابراین دایرههای بزرگ، نماد آب کثیفتر،و دایرههای کوچک، نماد آب تمیزتر است. آبراههای داخلی را می بینید . این همه دادههایی است کهدر پنج سال گذشتهدر شهر نمونه برداری شدهاند. و آبراههای داخلی،به طور کلی، آلودهتر هستند. حس میکنید، درسته؟ و دایرههای بزرگتر کثیفتر هستند.و من چند چیز از این یاد گرفتم . شماره یک: هرگز در هر چیزی که در "نهر"و یا "کانال " به پایان میرسد شنا نکنم. اما شماره دو: من همچنین کثیف ترین آبراهه در شهر نیویورک را پیداکردم، با این معیار، و با یک اندازهگیری. در آبراهه کونیآیلند، که خوشبختانه همان کونیآیلندی نیست که شما در آن شنا میکنید . این در سمت دیگر آن است. اما در نهر کونیآیلند، 94 درصدنمونههایی که در پنج سال گذشته گرفته شده است سطح تهنشینی بسیار بالایی داشته است که برخلاف قانون دولت مبنی برای شنا در آب است.
و این از آن نوع رویدادهایی نیست کههمانطور که شما میبینید در گزارش شهر به آن افتخار کنند، درسته؟ و این در صفحه اول سایت nyc.gov نخواهد بود. شما قرار نیست آن را در آنجا ببینید، اما این واقعیت که می توانیم دادهها را دریافت کنیمبسیار باورنکردنی است. اما بار دیگر، خیلی آسان هم نیست، چرا که این داده ها در پورتال داده باز نبودند. اگر شما به پورتال داده باز برای گرفتن آنها میرفتید، شما فقط یک قطعه از آن را میدیدید،شاید یک سال و یا چند ماه اما در حقیقت، آنها در وب سایت وزارت حفاظت از محیط زیست بودند و هرکدام از آنها در یک برگه اکسل بودندکه با بقیه برگهها متفاوت بودند. تمام عنوانها هم متفاوت است:اگر شما کپی، چسباندن، را انجام دهید متوجه میشوید. هنگامی که شما این کار را انجام بدهید می توانید نقشه را تهیه کنیدو این عالی است، اما یک بار دیگر، می توانیم به عنوان یک شهر، بهتر از آن را انجام دهیم، ما می توانیم همه چیز را قانونمند کنیم.
و ما آنجا میرویم، چون وب سایتی است کهسوکریتا آن را ساخته است به نام پرتال داده باز شهر نیویورک. جایی که در آن ۱٫۱۰۰ داده بدون مزاحمت کنار هم قرار دارند از چیزهایی که من همین الان به شما گفتم ، و این اعداد در حال رشدند،و این عالی است. شما می توانید دادهها را در هر فرمتی دریافت کنید،سیویاس، پیدیاف و یا سند اکسل. هر آنچه که بخواهید،می توانید دادهها را به همان صورت دریافت کنید. مشکل این است که، هنگامی که این کار را انجام دهید، خواهید دید که هر کدام از سازمانها آدرسهای خود را به شیوهای متفاوت کد گزاری میکنند به همین دلیل یکی به نام خیابان،خیابان تقاطع دار، خیابان، شهرک، آدرس، ساختمان،آدرس ساختمان است. بنابراین یک بار دیگر، حتی زمانی که ما این پورتال را داریم شما باید وقت خود را برای آن صرف کنید، شما وقت خود برای قانونمند سازی فیلد آدرس صرف میکنید و این بهترین استفاده از وقت شهروندان مان نیست میتوانیم به عنوان یک شهر بهتر از آن را انجام دهیم. میتوانیم آدرسهایمان را استاندارد سازی کنیم، و اگر ما، این کار را انجام دهیممی توانیم نقشههای بیشتری مانند این را دریافت کنیم.
این یک نقشه از شیرهای آتش نشانی در شهر نیویورک است. اما نه فقط هر شیر آتش نشانی. اینها تمام ۲۵۰ شیر آتش نشانی برتراز نظر جریمه پارکینگ هستند (خنده حضار) بنابراین من چند چیز از این نقشه یادگرفتم،و من واقعا این نقشه را دوست دارم. شماره یک، در قسمت شمال شرقی شهر پارک نکنید. پارک نکیند. مهم نیست که کجا پارک میکنید،شما به خاطر شیر آتش نشانی جریمه میشوید. شماره دو، دو تا از پردرآمد ترین شیرهای آتش نشانیدر تمام شهر نیویورک را پیدا کردم، و آنها در جنوب شرقی هستند، آنها درآمدی بیش از ۵۵٫۰۰۰ دلار در سال را برای جریمه پارکینگ به همراه دارند. وقتی من متوجه آن شدم اندکی برایم عجیب بود، بنابراین من تحقیقات کمی انجام دادم و مشخص شدفقط یک شیر آتش نشانی است و چیزی که محدوده حاشیه پیادهرو نام دارد، که مانند یک فضای هفت قوتی برای پیاده روی است، و سپس یک محل پارکینگ. و به این ترتیب ماشینها میآمدند،و آن شیر آتش نشانی -- "این تنها راهی است که وجود دارد، من خوب هستم،" و در واقع یک محل پارک وجود داردکه به زیبایی برای آنها رنگ آمیزی شده است. آنها در آن محل پار خواهند کرد، و انوایپیدی با این علامت مخالف است پس آنها را جریمه خواهد کرد و البته فقط من نبودم که جریمه پارکینگ را پیدا کردم. این سرویس نمای خیابان نقشه گوگل است که همان جریمه پارکینگ را پیدا میکند.
بنابراین ،در مورد این موضوع در وبلاگم نوشتمدر پرتال تحلیل های کمی داده باز شهر نیویورک، و وزارت حمل ونقل پاسخ داد، و آنها گفتند، تا زمانی که وزارت حمل ونقلهیچ گونه شکایتی درباره این مکان، دریافت نکرده است ما نشانه گذاری مسیر را بررسی خواهیم کردو هر گونه تغییرات مناسبی را اعمال میکنیم " و من با خودم فکر کردماین یک پاسخ معمولی دولتی است، باشه، و زندگی من به حرکت ادامه داد.
اما پس از آن، چند هفته بعد،چیزی باور نکردنی اتفاق افتاد. آنها آن محل را دوباره رنگ آمیزی کردند و برای یک ثانیه با خودم فکر کردم من آینده ای از دادههای باز را میبینم چوندر مورد آنچه در اینجا اتفاق افتاده است فکر میکنم . برای مدت پنج سال، این محلی برای جریمه بوده است، و آن گیج کننده بود، و سپس یک شهروند چیزی را میابد،آنها به شهر میگویند، و در عرض چند هفته مشکل برطرف شد. این شگفت انگیز است. و بسیاری از مردمدادههای باز را به عنوان دیده بان میبینند. فقط این نیست، این در مورد شریک بودن است ما می توانیم شهروندان را ما توانمند کنیم تاشرکای بهتر برای دولت،باشند و آنقدر هم سخت نیست. تمام چیزی که ما نیاز داریم چند تغییر است. اگر شما برای دسترسی آزاد به اطلاعات قانونگذاری میکنید اگر شما میبینید که دادههایتان بارها و بارها، برای دسترسی آزاد قانونگذاری شدهاند، اجازه دهید آن را به مردم بدهیم،که نشانه ای از بهتر بودن عمومی سازی آن است و اگر شما یک سازمان دولتی هستید که پیدیافها را انتشار میدهد اجازه دهید تا از قانونی که شما را مجبور به ارسال آنهابا دادههای اساسی میکند، عبور کنیم چرا که داده ها از جایی میآیند من نمی دانم از کجا، اما از جایی میآیند، و شما می توانید پیدیاف آنها را منتشرکنید و اجازه دهید تا چند استاندارد باز دادههااتخاذ و اشتراک گذاری شوند بیایید با آدرسهایمان در شهر نیویورک شروع کنیم. اجازه دهید تا فقط آدرسهایمان را قانونمند سازی کنیم. زیرا که نیویورک ، یک پیشگام در دادههای باز است. با این حال، ما کاملا در دادههای باز پیشگام هستیم و اگر ما شروع به قانونمندسازی بکنیم،و استاندارد دادههای باز را تنظیم کنیم، دیگران نیز پیروی میکنند. دولت هم پیروی میکند، و شاید هم دولت فدرال، کشورهای دیگر هم پیروی خواهند کرد، و ما از زمانی که شما بتوانید یک برنامه بنویسید و نقشهای با دادههای بیش از ۱۰۰ کشور جهان تهیه کنید،دور نیستیم. این یک داستان علمی تخیلی نیست.درحقیقت بسیار به آن نزدیک هستیم .
راستی،با این ها چه کسی را قدرتمند میکنیم؟ زیرا این فقط به جان کراس و کریس وانگ ختم نمیشود. صدها میتآپ درحال حاضر در شهر نیویورک فعال هستند، میتآپ های فعال و پر جنبوجوش هزاران نفر از مردم در این میتآپ ها شرکت میکنند. این مردم بعد از کارشان و آخر هفتهها کنار هم میآیند و آنها در این میتآپ ها شرکت میکنند و به دنبال دادههای باز هستند و شهرمان را به مکانی بهتر تبدیل میکنند. گروه هایی مانند انوایسی بتا، در هفته گذشتهچیزی به نام citygram.nyc را منتشر کردهاند که به شما اجازه میدهد، مشترک ۳۱۱ شکایت بشوید در اطراف خانه،و یا در اطراف محل کارتان. شما آدرس خود را قرار میدهید،و شکایت محلی را دریافت کنید. و بعد ازاین همه،این فقط یک جامعه تکنولوژیک نیست بلکه این برنامه ریزان شهری است،مثل دانش آموزانی که من در پرات آموزش می دهم. این سیاست طرفداران است، این همه است، این شهروندانی با گذشتههای متفاوت است. و با برخی تغییرات تدریجی کوچک، ما می توانیم قفل اشتیاق و توانایی شهروندان را باز کنیم برای مهار دادههای باز و تبدیل شهر به مکانی بهتر، چه این یک مجموعه داده باشد و چه یک مکان پارکینگ.
متشکرم.
(تشویق حضار)