ما چگونه بدترین مکان برای پارک خودرو را در شهر نیویورک پیدا میکنیم — با استفاده از داده‌های بزرگ

متن سخنرانی :
۹٫۴۰۰ کیلومتر جاده . ۹۴۰ کیلومتر مسیر زیرزمینی مترو، ۶۴۰ کیلومتر مسیر دوچرخه سواری و ۸۰۰ مسیر تراموا، اگر شما تابحال به جزیره روزولت رفته باشید را خواهید دید.
اینها اعدادی هستند که زیرساخت های شهر نیویورک را تشکیل می دهند. اینها آماری از زیرساخت های شهر ما است. اینها اعداد و ارقامی هستند که درگزارش‌های آژانس‌های شهری منتشر میشوند به عنوان مثال، وزارت حمل و نقل احتمالا به شما خواهد گفت که چند کیلومتر از جاده را نگهداری میکنند. مقامات حمل و نقل شهری، از اینکه چندین مایل مسیر زیرزمینی مترو وجود دارد، به خود می‌بالند بیشتر سازمان‌های شهری به ما آمار میدهند. این گزارشی از سال جاری است از نمایندگی تاکسی‌ها و لیموزین‌ها، از آن متوجه میشویم که تقریبا ۱۳٫۵۰۰ تاکسی در شهر نیویورک وجود دارد. بسیار جالب توجه است، درسته ؟ اما آیا شما تا به حال فکر کرده‌اید که این اعداد از کجا آمده‌اند ؟ از آنجا که این اعداد باید وجود داشته باشند،فردی در آژانس‌های شهری باید بایستد و بگوید، اینجا اعدادی هست که ممکن است کسی بخواهد بداند. در اینجا اعدادی هستندکه شهروندان ما می خواهند بدانند. بنابراین به داده‌های خام خود رجوع کردند، آنها شمارش کردند، جمع زدند ، آنها محاسبه کردند، و سپس گزارش‌هایی را ارائه دادند، و آن گزارش‌ها اعدادی مانند این هستند.
مشکل این است که، آنها چگونه تمام پرسش های ما را می دانند؟ ما سوالات زیادی داریم. در واقع، میتوان اینطور برداشت کرد کهسوالات بی پایانی وجود دارد که ما می توانیم در مورد شهر‌مان بپرسیم. سازمان‌ها هرگز نمی توانند این موضوع را تحمل کنند. بنابراین الگو به طور دقیق کار نمی‌کند،و من فکر می‌کنم سیاست‌گذاران ما متوجه آن هستند ، زیرا در سال ۲۰۱۲، شهردار بلومبرگقانونی را به امضا رسانید که بلند پروازانه‌ترین و جامع‌ترین قانون داده باز در کشور نام گرفت از بسیاری از جهت‌ها او درست میگفت. در دو سال گذشته،این شهر ۱٫۰۰۰ مجموعه داده منتشر کرده اند در پورتال داده باز شهر، و این بسیار عالی است. بنابراین شما تنها به داده‌هایی شبیه این نگاه میکنید، و به جای آنکه فقط تاکسی‌ها را بشماریم ، می توانیم سوالات متفاوتی بپرسیم.
پس من یک سوال دارم. ساعت شلوغی در شهر نیویورک چه موقعی است؟ و این می تواند بسیار مشکل ساز باشد.ساعت شلوغی دقیقا چه موقعی است؟ و من با خودم فکر میکردم،این تاکسی‌ها فقط اعداد نیستند، اینها دستگاه‌های ضبط GPS می‌باشندکه در اطراف خیابان‌های شهر ما رانندگی میکنند هر سواری که آنها انجام میدهند ضبط میکنند. این داده‌ها در آنجا وجود دارند،و من به آنها نگاه میکنم، طرحی از سرعت متوسط تاکسی‌ها در شهر نیویورکدر طول روز درنظر را میگیرم. شما می توانید ببینید که از حدود نیمه شب تاحدود ۵:۱۸ صبح، سرعت افزایش میابد، و در آن موقع،همه چیز تغییر میکند، و آنها کندتر و کندتر و کندتر میشوندتا حدود ۸:۳۵ صبح، زمانی که آنها در حدود سرعتیازده‌و‌نیم مایل در ساعت متوقف میشوند متوسط تاکسی که یازده‌و‌نیم مایل در ساعت در خیابان‌های شهر تردرد میکنند، و روشن میشود که آنها به همین وضع باقی می‌مانند برای تمام روز. (خنده حضار) بنابراین به خودم گفتم، حدس می زنمهیچ ساعت شلوغی در شهر نیویورک وجود ندارد. بلکه یک روز شلوغی وجود دارد. حس می‌کنید. و این به دو دلیل مهم است. اگر شما یک برنامه ریز حمل و نقل هستید،بسیار جالب است که بدانید. اما اگر شما می‌خواهید به سرعت به جایی بروید، میدانید که هشدار ساعت خود را برای ۰۴:۴۵ صبح تنظیم کنید و البته همه‌ی شما این کار را انجام میدهید. نیویورکی‌ها، درسته ؟
اما پشت این داده‎ها داستانی وجود دارد. اگر این داده‌ها در دسترس نبودندآن وقت روشن میشد. در واقع این از چیزی به نامقانون آزادی اطلاعات به دست می‌آید و یا یک تقاضای FOIL. این فرمی است که می‌توانید دروب سایت نمایندگی تاکسی و لیموزین‌ها پیدا کنید . به منظور دسترسی به این داده‌ها،شما نیاز به دریافت این فرم دارید، آن را پر کنید، و آنها شما را مطلع میکنند، مردی به نام کریس وانگاین کار را دقیقا انجام داد. کریس رفت، و آنها به او گفتند، "فقط کافی است تا با یک برند جدید هارد دیسک به دفتر ما بیایی، آن را را برای پنج ساعت در اینجا بگذاری،ما داده‌ها را کپی می‌کنیم و آن را به شما برمیگردانیم. " و این جایی است که این داده‌ها از آنجا آمده اند خوب، کریس از آن دسته افرادی است که می خواهد اطلاعات در دسترس عموم باشد، پس آن داده‌ها را آنلاین قرار داد تا همه استفاده کنند،وبه همین دلیل است که این نمودار ها پدید آمده‌اند. و واقعیت شگفت‌انگیز این است کهدستگاه‌های ضبط GPS (سامانه موقعیت‌یاب جهانی)- واقعا خوب کار میکنند. این واقعیت است که شهروندانی داریمکه با هارد‌دیسک هایی در اطرف ما حرکت میکنند و داده ها را از آژانس‌های شهری جمع کردهتا آن را به عموم مردم برسانند- این داده‌ها به نوع عمومی بودند ،شما می توانستید آنها را دریافت کنید، اما هرچند"دردسترس" بود ولی عمومی نبود. به عنوان یک شهر می توانیم بهتر از آن را انجام دهیم. ما نیاز نداریم تا شهروندانماندر اطراف با هارد دیسک‌هایی راه بروند
اکنون،در پشت تقاضای فویل هر مجموعه داده‌ای نمی باشد. این نقشه ای است که در مورد خطرناک‌ترین تقاطع‌ها در شهر نیویورک تهیه کرده ام. بر اساس حوادث دوچرخه سواری. پس، نواحی قرمز رنگ خطرناک تر می باشند. و آنچه که در نگاه اول نشان می‌دهد بخش شرقی منهتن است، به خصوص در مناطق پایین تر منهتن،حوادث دوچرخه سواری بیشتر است. که ممکن است با معنی باشد زیرا دوچرخه سواران بیشتریاز پل‌های آنجا پایین می‌آیند . اما نقاط دیگر نیز، ارزش آن را دارند که بررسی شوند. اینجا ویلیامزبرگ است.اینجا خیابان روزولت در کویینز است. و این دقیقا همان نوع داده ای است که ما برای پروژه دید صفر نیاز داریم. این دقیقا همان چیزی است که به دنبال آن هستیم.
اما پشت این داده ها نیز، داستانی وجود دارد. این داده‌ها همینطوری ظاهر نمی‌شوند. چند نفر از شما این لوگو را می‌شناسید؟ بله، من حرکت‌هایی را میبینم. آیا شما تاکنون برای کپی کردنو چسباندن داده از فایل‌های پی‌دی‌اف تلاش کرده‌اید و این را حس کرده‌اید؟ من حرکت‌هایی بیشتری را میبینم. بیشتر شما تلاشی بری کپی کردن و چسباندن داده‌ها انجام داده‌ایدپس این لوگو را میشناسید. من آن را دوست دارم.
پس آنچه اتفاق می‌افتد این است که آن داده‌ها به صورت پی‌دی‌اف بودند. در واقع، صدها و صدها و صدها صفحه پی‌دی‌اف که توسط ادارهٔ پلیس نیویورک قرار داده شده اند ، و به منظور دسترسی به آن،شما یا مجبور به کپی و چسباندن داده‌ها هستید برای صدها و صدها ساعت، و یا آنکه شما می توانید جان کراس باشید. جان کراوس شبیه به این بود، من نمی‌خواهم داده‌ها را کپی کنم و بچسبانم.من می‌خواهم یک برنامه بنویسم. که کمک رسان سقوط باند داده‌های ان‌وای‌پی‌دی نام گرفت ، و این برنامه به وب سایت ان‌وای‌پی‌دی می رودو فایل‌های پی‌دی‌اف را دریافت میکند. هر روز آن را جستجو میکند.و اگر پی‌دی‌اف را پیدا کند، آن را دریافت میکند. و سپس نوعی برنامه تبدیل پی‌دی‌اف را اجرا میکند که خروجی آن فایل متنی است و آن را بر روی اینترنت قرار میدهد و سپس مردم می توانند نقشه‌هایی مانند آن را پیدا کنند. این واقعیت که داده‌ها در اینجا هستند،واین که ما به آنها دسترسی داریم - هر رویدادی، یک ردیف در این جدول است. شما می توانید تصور کنید که چقدرفایل پی‌دی‌اف خواهد بود. این واقعیت که مابه آن دسترسی داریم بسیار عالی است، اما اجازه دهید آن را در فرم پی‌دی‌اف ایجاد نکنیم ، چرا که پس از آن ما شهروندان‌مان را داریم کهمبدل‌های پی‌دی‌اف را مینویسند. البته این بهترین استفاده اززمان شهروندان‌مان نیست، و ما به عنوان یک شهر می‌توانیم کار بهتری انجام دهیم.
در حال حاضر، خبر خوب این است کهدولت بلاسیو به تازگی این داده‌ها را در چند ماه گذشته منتشرکرده است پس اکنون ما می‌توانیمبه آین داده‌ها دسترسی داشته باشیم، اما داده‌های بسیاری وجود دارند که هنوز در پی‌دی‌اف ها مدفون هستند. به عنوان مثال، داده‌های مربوط به جرم و جنایت هنوز هم تنها فقط یه صورت پی‌دی‌اف در دسترس است. و نه فقط دادههای جرم و جنایت،بلکه بودجه شهر هم همینطور در حال حاضر بودجه شهر ما فقط در فرم پی‌دی‌اف قابل خواندن است. و فقط ما نیستیم که نمیتوانیم این داده‌ها را تحلیل کنیم -- حتی قانون گذاران ماکه برای بودجه رای میدهند فقط آن را به صورت پی‌دی‌اف دریافت میکنند. بنابراین قانون‌گذاران ما هم نمیتوانند بودجه‌ای که به آن رای دادند را تجزیه و تحلیل کنند. و فکر می کنم به عنوان یک شهر،کمی بهتر از آنچه اکنون هست را می توانیم انجام دهیم .
در حال حاضر، داده‌های بسیاری وجود داردکه در فایل‌های پی‌دی‌اف پنهان نیستند. این نمونه‌ای از نقشه‌ای است که من ساخته‌ام و این کثیف‌ترین آبراه در شهر نیویورک است. اکنون، چگونه میزان کثیفی را اندازه میگیریم؟ خوب، اندکی عجیب و غریب است، اما برای آن، به سطح کلیفرم ته نشین شده نگاه کردم که معیار اندازه‌گیری ته‌نشینی در هر یک از آبراهه‌های شهر است. به همان اندازه که دایره بزرگتر استآلودگی هم بیشتر است، بنابراین دایره‌های بزرگ، نماد آب کثیف‌تر،و دایره‌های کوچک، نماد آب‌ تمیزتر است. آبراه‌های داخلی را می بینید . این همه داده‌هایی است کهدر پنج سال گذشتهدر شهر نمونه برداری شده‌اند. و آبراه‌های داخلی،به طور کلی، آلوده‌تر هستند. حس میکنید، درسته؟ و دایره‌های بزرگتر کثیفتر هستند.و من چند چیز از این یاد گرفتم . شماره یک: هرگز در هر چیزی که در "نهر"و یا "کانال " به پایان می‌رسد شنا نکنم. اما شماره دو: من همچنین کثیف ترین آبراهه در شهر نیویورک را پیداکردم، با این معیار، و با یک اندازه‌گیری. در آبراهه کونی‌آیلند، که خوشبختانه همان کونی‌آیلندی نیست که شما در آن شنا میکنید . این در سمت دیگر آن است. اما در نهر کونی‌آیلند، 94 درصدنمونه‌هایی که در پنج سال گذشته گرفته شده است سطح ته‌نشینی بسیار بالایی داشته است که برخلاف قانون دولت مبنی برای شنا در آب است.
و این از آن نوع رویدادهایی نیست کههمانطور که شما میبینید در گزارش شهر به آن افتخار کنند، درسته؟ و این در صفحه اول سایت nyc.gov نخواهد بود. شما قرار نیست آن را در آنجا ببینید، اما این واقعیت که می توانیم داده‌ها را دریافت کنیمبسیار باورنکردنی است. اما بار دیگر، خیلی آسان هم نیست، چرا که این داده ها در پورتال داده باز نبودند. اگر شما به پورتال داده باز برای گرفتن آنها میرفتید، شما فقط یک قطعه از آن را می‌دیدید،شاید یک سال و یا چند ماه اما در حقیقت، آنها در وب سایت وزارت حفاظت از محیط زیست بودند و هرکدام از آنها در یک برگه اکسل بودندکه با بقیه برگه‌ها متفاوت بودند. تمام عنوان‌ها هم متفاوت است:اگر شما کپی، چسباندن، را انجام دهید متوجه میشوید. هنگامی که شما این کار را انجام بدهید می توانید نقشه را تهیه کنیدو این عالی است، اما یک بار دیگر، می توانیم به عنوان یک شهر، بهتر از آن را انجام دهیم، ما می توانیم همه چیز را قانونمند کنیم.
و ما آنجا میرویم، چون وب سایتی است کهسوکریتا آن را ساخته است به نام پرتال داده باز شهر نیویورک. جایی که در آن ۱٫۱۰۰ داده بدون مزاحمت کنار هم قرار دارند از چیزهایی که من همین الان به شما گفتم ، و این اعداد در حال رشدند،و این عالی است. شما می توانید داده‌ها را در هر فرمتی دریافت کنید،سی‌وی‌اس، پی‌دی‌اف و یا سند اکسل. هر آنچه که بخواهید،می توانید داده‌ها را به همان صورت دریافت کنید. مشکل این است که، هنگامی که این کار را انجام دهید، خواهید دید که هر کدام از سازمان‌ها آدرس‌های خود را به شیوه‌ای متفاوت کد گزاری میکنند به همین دلیل یکی به نام خیابان،خیابان تقاطع دار، خیابان، شهرک، آدرس، ساختمان،آدرس ساختمان است. بنابراین یک بار دیگر، حتی زمانی که ما این پورتال را داریم شما باید وقت خود را برای آن صرف کنید، شما وقت خود برای قانونمند سازی فیلد آدرس صرف میکنید  و این بهترین استفاده از وقت شهروندان مان نیست می‌توانیم به عنوان یک شهر بهتر از آن را انجام دهیم. می‌توانیم آدرس‌هایمان را استاندارد سازی کنیم، و اگر ما، این کار را انجام دهیممی توانیم نقشه‌های بیشتری مانند این را دریافت کنیم.
این یک نقشه از شیرهای آتش نشانی در شهر نیویورک است. اما نه فقط هر شیر آتش نشانی. اینها تمام ۲۵۰ شیر آتش نشانی برتراز نظر جریمه پارکینگ هستند (خنده حضار) بنابراین من چند چیز از این نقشه یادگرفتم،و من واقعا این نقشه را دوست دارم. شماره یک، در قسمت شمال شرقی شهر پارک نکنید. پارک نکیند. مهم نیست که کجا پارک میکنید،شما به خاطر شیر آتش نشانی جریمه میشوید. شماره دو، دو تا از پردرآمد ترین شیرهای آتش نشانیدر تمام شهر نیویورک را پیدا کردم، و آنها در جنوب شرقی هستند، آنها درآمدی بیش از ۵۵٫۰۰۰ دلار در سال را برای جریمه پارکینگ به همراه دارند. وقتی من متوجه آن شدم اندکی برایم عجیب بود، بنابراین من تحقیقات کمی انجام دادم و مشخص شدفقط یک شیر آتش نشانی است و چیزی که محدوده حاشیه پیاده‌رو نام دارد، که مانند یک فضای هفت قوتی برای پیاده روی است، و سپس یک محل پارکینگ. و به این ترتیب ماشین‌ها می‌آمدند،و آن شیر آتش نشانی -- "این تنها راهی است که وجود دارد، من خوب هستم،" و در واقع یک محل پارک وجود داردکه به زیبایی برای آنها رنگ آمیزی شده است. آنها در آن محل پار خواهند کرد، و ان‌وای‌پی‌دی با این علامت مخالف است پس آنها را جریمه خواهد کرد و البته فقط من نبودم که جریمه پارکینگ را پیدا کردم. این سرویس نمای خیابان نقشه گوگل است که همان جریمه پارکینگ را پیدا میکند.
بنابراین ،در مورد این موضوع در وبلاگم نوشتمدر پرتال تحلیل های کمی داده باز شهر نیویورک، و وزارت حمل ونقل پاسخ داد، و آنها گفتند، تا زمانی که وزارت حمل ونقلهیچ گونه شکایتی درباره این مکان، دریافت نکرده است ما نشانه گذاری مسیر را بررسی خواهیم کردو هر گونه تغییرات مناسبی را اعمال میکنیم " و من با خودم فکر کردماین یک پاسخ معمولی دولتی است، باشه، و زندگی من به حرکت ادامه داد.
اما پس از آن، چند هفته بعد،چیزی باور نکردنی اتفاق افتاد. آنها آن محل را دوباره رنگ آمیزی کردند و برای یک ثانیه با خودم فکر کردم من آینده ای از داده‌های باز را میبینم چوندر مورد آنچه در اینجا اتفاق افتاده است فکر می‌کنم . برای مدت پنج سال، این محلی برای جریمه بوده است، و آن گیج کننده بود، و سپس یک شهروند چیزی را میابد،آنها به شهر میگویند، و در عرض چند هفته مشکل برطرف شد. این شگفت انگیز است. و بسیاری از مردمداده‌های باز را به عنوان دیده بان میبینند. فقط این نیست، این در مورد شریک بودن است ما می توانیم شهروندان را ما توانمند کنیم تاشرکای بهتر برای دولت،باشند و آنقدر هم سخت نیست. تمام چیزی که ما نیاز داریم چند تغییر است. اگر شما برای دسترسی آزاد به اطلاعات قانون‌گذاری میکنید اگر شما میبینید که داده‌هایتان بارها و بارها، برای دسترسی آزاد قانون‌گذاری شده‌اند، اجازه دهید آن را به مردم بدهیم،که نشانه ای از بهتر بودن عمومی ‌سازی آن است و اگر شما یک سازمان دولتی هستید که پی‌دی‌اف‌ها را انتشار میدهد اجازه دهید تا از قانونی که شما را مجبور به ارسال آنهابا داده‌های اساسی میکند، عبور کنیم چرا که داده ها از جایی می‌آیند من نمی دانم از کجا، اما از جایی می‌آیند، و شما می توانید پی‌دی‌اف آنها را منتشرکنید و اجازه دهید تا چند استاندارد باز داده‌هااتخاذ و اشتراک گذاری شوند بیایید با آدرس‌هایمان در شهر نیویورک شروع کنیم. اجازه دهید تا فقط آدرس‌هایمان را قانون‌مند سازی کنیم. زیرا که نیویورک ، یک پیشگام در داده‌های باز است. با این حال، ما کاملا در داده‌های باز پیشگام هستیم و اگر ما شروع به قانونمند‌سازی بکنیم،و استاندارد داده‌های باز را تنظیم کنیم، دیگران نیز پیروی میکنند. دولت هم پیروی میکند، و شاید هم دولت فدرال، کشورهای دیگر هم پیروی خواهند کرد، و ما از زمانی که شما بتوانید یک برنامه بنویسید  و نقشه‌ای با داده‌های بیش از ۱۰۰ کشور جهان تهیه کنید،دور نیستیم. این یک داستان علمی تخیلی نیست.درحقیقت بسیار به آن نزدیک هستیم .
راستی،با این ها چه کسی را قدرتمند میکنیم؟ زیرا این فقط به جان کراس و کریس وانگ ختم نمیشود. صدها میت‌آپ درحال حاضر در شهر نیویورک فعال هستند، میت‌آپ ‌های فعال و پر جنب‌و‌جوش هزاران نفر از مردم در این میت‌آپ ها شرکت میکنند. این مردم بعد از کارشان و آخر هفته‌ها کنار هم می‌آیند و آنها در این میت‌آپ ها شرکت میکنند و به دنبال داده‌های باز هستند و شهرمان را به مکانی بهتر تبدیل میکنند. گروه هایی مانند ان‌وای‌سی بتا، در هفته گذشتهچیزی به نام citygram.nyc را منتشر کرده‌اند که به شما اجازه میدهد، مشترک ۳۱۱ شکایت بشوید در اطراف خانه‌،و یا در اطراف محل کارتان. شما آدرس خود را قرار میدهید،و شکایت محلی را دریافت کنید. و بعد ازاین همه،این فقط یک جامعه تکنولوژیک نیست  بلکه این برنامه ریزان شهری است،مثل دانش آموزانی که من در پرات آموزش می دهم. این سیاست طرفداران است، این همه است، این شهروندانی با گذشته‌های متفاوت است. و با برخی تغییرات تدریجی کوچک، ما می توانیم قفل اشتیاق و توانایی شهروندان را باز کنیم برای مهار داده‌های باز و تبدیل شهر به مکانی بهتر، چه این یک مجموعه داده باشد و چه یک مکان پارکینگ.
متشکرم.
(تشویق حضار)

دیدگاه شما چیست؟

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *