آمار و بحث های پیرامون آن

پ ن : در پاسخی افرادی که اعتقاد دارند آمار دروغ است. معمولا گفته فردریک ماستلر را یادآور می شوم که می گوید: درست است که به کمک آمار می توان دروغ گفت اما دروغ گفتن بدون آن کار ساده تری است. دیوید جی هند

Statistics: A Very Short Introduction

مشغول خواندن کتاب شرح مختصر آمار نوشته دیوید جی هند هستم و نکاتی به ذهنم آمد که خواستم در اینجا برایتان بنویسم. بدبینی های زیادی در خصوص آمار وجود دارد و دلایل عمده ی آن بر می گردد به سو استفاده کلاهبرداران از آمار که با انواع ترفندها در تلاش هستند تا نتایجی اشتباه از داده های درست بگیرند.

امروزه با ورود کامپیوتر و توانایی پردازشی آن داده های زیادی را میتوان در کسری از زمان پردازش کرد و یا نتایج مختلفی را از آن برداشت کرد. هر چند خود علم آمار جدید بیشتر از دو قرن قدمت ندارد و انجمن سلطنتی آمار(Royal Statistics Society) در سال ۱۸۳۴ و انجمن آمار آمریکا در سال ۱۸۳۹ و مرکز آمار ایران در سال ۱۳۱۸ شمسی پایه گذاری شده اند و برای اولین بار هم اولین دانشکده ی آمار در سال ۱۹۱۱ در دانشگاه کالج در لندن پایه گذاری شده است.

یکی از شاخه های مهم آمار نیز احتمال است که در قرن ۱۷ و در پاسخ به سوالات متعدد شرط بندی ها به وجود آمد اگر چه در دنیای امروز استفاده از احتمال در صنعت بیمهبیشتر به چشم می آید و مثلا شرکت های بیمه با محاسبه امید ریاضی به این نتیجه میرسند که وارد یک بازی شوند یا نه.

در سه دهه اخیر شاهد پیشرفت بسیار زیاد شاخه های دیگری از تحلیل داده خصوصا بر مبنای کامپیوتر بوده ایم که شامل:

Machine Learning , pattern recognition,data mining است. اینکه به خواندن آمار علاقه پیدا کرده ام و میخواهم اصول اولیه آن را هم بدانم پایه بودن بحث های آن در data mining و هر نوع استفاده از دیتا هست.

دقت همه ی نمودارهای آماری بستگی به کیفیت داده های آن دارد و کسی که میخواهد کار جمع آوری داده ها را چه به صورت فرم های الکترونیکی و چه به صورت پرسشنامه های فیزیکی انجام دهد باید پارامترهای زیادی را جدا از سوالات اصلی مدنظر قرار دهد تا باعث گمراه شدن نشود.

مثلا من زمانی که در شرکت نفت کار میکردم دیب یا اندازه ی تانکرها و مخازن را به این صورت اعلام میکردند که ۵۰۰۰۰۰ لیتر بنزین در دمای ۱۵ درجه سانتی گراد اندازه گیری شده و یا کسری مخازن ۱ میلیون لیتر در دمای ۲۰ درجه است چون میزان لیتر بدون در نظر گرفتن دمای محیط بی فایده و غیر دقیق است و با توجه به سرد و گرم شدن دما و انبساط و انقباض آن لیتراژ هم کم و زیاد میشه مثلا راننده وقتی صبح بار بنزین میبره و شب به پمپ بنزین میرسه امکان داره ۵۰۰ لیتر کسری بیاره و مالک جایگاه یا متصدی اونجا یقه اش رو بگیره و به دزدی متهمش کنه! پس داده ها به تنهایی کافی نیستند بلکه شرایط پیرامونی اون داده هم مهمه.

در اکثر پرسشنامه ها به تجربه مشخص شده که افراد مسن تمایلی به درج سن خود ندارند به همین خاطر امکان داره ما حجم بزرگی از داده ها را به همین خاطر از دست بدهیم این ایراد حتی با مجبور کردنشان نیز فایده ای ندارد چرا که امکان داره سن را اشباه بنویسند یکی از راهکارها استفاده از متغیرهای پیش فرض است که سیستم افرادی که سنشان را نمی نویسند مسن تشخیص دهد! این البته یک روش ایده آل نیست و باید خطاهای آن نیز در نظر گرفته شود.

یک نمونه خطای دیگر آماری هم آمار خودکشی است چرا که خیلی از افراد قبل از اقدام به خودکشی نمینویسند که قصد خودکشی داشته اند (به دلیل از بین رفتن بیمه عمر برای خانواده و قضاوت دیگران و …) پس نمیشود زیاد به آمار خودکشی متکی بود در واقع آمار خودکشی فعلی آمار کسانی است که قبل از اقدام  به خودکشی به اینکار اقرار کرده اند .

یکی از راه های که گوگل برای امنیت Gmail استفاده میکند همین pattern recognition است مثلا شما همیشه از شرق ایران به حساب خود لاگین میکنید و اگر مثلا چندساعت بعد از یک کشور عربی لاگین کنید گوگل حدس میزند که حساب شما هک شده البته گوگل نمیداند ما ایرانی ها به واسطه استفاده از قند شکن هر روز با تغییر IP امکان دارد از یک گوشه ی جهان لاگین شویم! این اطلاعات ورود و اطلاعات آماری برای حسابهای بانکی و استفاده از عابر بانک هم کاربرد دارد مثلا اگر به فاصله یک ساعت از دو عابر بانک در دو شهر دور از هم استفاده کنیم سیستمهای بانکی این موضوع را به صورت هوشمندانه پی گیری خواهند کرد.

یکی  از اشتباهات آماری هم به فضای نمونه برمیگرده یادمه تو دانشگاه استاد آمار و احتمال میگفت تو ایران میرن تو خیابون نظر سنجی میکنن ساعت ۱۰ صبح  اون ساعت دانشجو و استاد توی دانشگاه هستند دکتر و مهندس هم سر کار یعنی نتایج آماری ما بر اساس نظرات یک عده آدم علافه و بیکاره که ساعت ۱۰ صبح تو خیابون میچرخن!

یکی از مشهورترین اشتباهات فضای نمونه در سال ۱۹۳۶ و در آمریکا اتفاق افتاد زمانی که مجله ی literary Digest به اشتباه پیش بینی کرد لاندون به راحتی رزولت را در انتخابات ریاست جمهوری شکست میدهد. سرچشمه ی این اشتباه هم اینجا بود که فرم ها ی پرسشنامه فقط برای افرادی که هم تلفن و هم خودرو داشتند ارسال شده بود و این افراد در آن زمان قشر ثروتمند جامعه را تشکیل می ساختند.

پس در آمار مهم تر از اینکه بدانیم که یک عدد چیست باید بفهمیم که یک عدد چه معنی میدهد. در واقع آمار علم جستجوی مجهولات با تکیه بر مشهودات است . 

زیبایی اعداد

بسیاری از افراد این حقیقت که داده های عددی می توانند نشان دهنده ی زیبایی دنیای واقعی باشند را نمی پذیرند. آنها احساس میکنند که تبدیل اشیا و موضوعات به اعداد چیزی شبیه جادوگری است. در واقع نمی توان مرتکب اشتباهی بزرگ تر از این شد چرا که اعداد اجازه می دهند تا این زیبایی را بهتر و عمیق تر درک کرده و از آنها لذت ببریم. وقتی پدیده ای را به شکل عددی توصیف می کنیم بسیاری از نکات مبهم آن از بین می رود. مثلا اگر بگویم ۴ نفر در اتاق  حضور دارند کاملا متوجه منظورم می شوید اما در مقابل وقتی میگویم فلان شخص آدم جالبی است امکان دارد مقصودم را از این حرف درک نکنید یا حتی با اینکه وی شخص جالبی باشد موافق نباشید. اما قطعا به اینکه ۴ نفر در اتاق هستند مخالفت نخواهید کرد. اعداد و ارقام در تمام دنیا و بدون توجه به ملیت، دین، جنسیت، سن یا هر ویژگی شخصیتی دیگر قابل درکند. ص ۴۰ – کتاب معرفی شرح مختصر آمار نوشته دیوید جی هند.

در این کتاب کوچک مفاهیم اولیه میانگین، مد، میانه، دامنه تغییرات، انحراف معیار و چولگی به خوبی و به سادگی شرح داده شده. بخش پایانی کتاب هم در مورد احتمال و مدل های آماری است.

تلاش برای استفاده از دیتا در فروش و بازاریابی

قبلا گفتم که مشکلات زیادی بر سر راه شرکتهای ما وجود دارد که نمیتوانیم به خوبی از دیتا در بازاریابی و فروش استفاده کنیم. والبته گفتم این موانع نباید سد راه ما شود. اما هر چه که جلوتر میروم به موانع چالشی بیشتر برخورد میکنم. در هر حال تصمیم گرفتم گزارشها و اطلاعات زیر را از نرم افزار مالی شرکت بیرون بکشم به نحوی که بتوان از آن استفاده کرد.

https://cdn.sisense.com/wp-content/uploads/industry-templates-ppc-dashboard-11.jpg

گزارشهایی که در گام اول به آن نیاز دارم شامل:

  •  در بازه ی یکساله چه محصولاتی بیشترین حجم فروش را داشته اند (بر حسب ریال)
  • در بازه ی یکساله چه محصولاتی بیشترین حجم فروش را داشته اند (بر حسب تعداد)
  • یک نمودار Bar Chart برای نشان دادن بازه های یکساله دو نمودار بالا نیاز داریم به عنوان مثال نشان دهد که محصول برتر فروردین چه بوده است.
  • بهترین مشتریان در طول سه سال به تفکیک دولتی و خصوصی بر اساس دو الگوری زیر:
  • تکرار (Frequency) : تعداد دفعاتی که هر مشتری در یک بازه زمانی مشخص خرید میکند و معمولا خریداران با تکراربیشتر مشتریان راضی تری به نظر میرسند.
  • مقدار پول (Monetary): میزان هزینه ای که مشتری در یک بازه زمانی مشخص پرداخت میکند را بیان میکند.
  • درصد رشد مشتریان جدید نسبت به سال قبل
  • گزارش سبد خرید به شرح زیر:
  • چه محصولاتی با هم فاکتور شده اند یعنی چند نوع سبد خرید داریم که بیشترین تکرار را داشته اند . اول باید تکرارهای بیشتر را پیدا کرد مثلا همراه با کابل شبکه چه چیزی خرید شده و بعد باید ۱۰ سبد خرید برتر را در طول سه سال پیدا کرد.
  • مقایسه حجم فروش و سود بخش خدمات و بخش فروش در سه سال
  • چند درصد مشتریان از خدمات پس از فروش استفاده کردند

توضیحات لازم:

  1. این گزارشات اولیه صرفا برای شروع کار است و به هیچ وجه نیاز شرکت را برآورده نمیکند
  2. گزارش سبد خرید بیشتر به خاطر پیشنهاد Bundle به شرکتهای همکار است
  3.  با نرم افزار مالی شرکت نمی توان این گزارشات را به صورت کامل گرفت و احتمالا مجبور داده ها را مستقیم از دیتابیس به جای دیگری انتقال دهم
  4. لزوما این گزارشات به درد همه ی شرکتها و همه ی سازمانها نمیخورد و من با توجه به نیاز و توانایی های خودمان آن را بررسی کرده ام .

ویژن و دیدگاه من در آینده به این صورت است که:

  1. یک وب سایت تعاملی و بسیار خوب داشته باشیم تا از داده ی بازدید کنندگان و تمایلات آنها استفاده کنیم
  2. سیستم CRM بسیار مناسبی برای شرکت راه اندازی کنیم
  3. ایمیل مارکتینگ را به صورت یکپارچه راه اندازی کنیم
  4. سیستم HR را هم در شرکت داشته باشیم
  5. در نهایت یک داشبورد حرفه ای درست کنیم تا تمامی اتفاقات شرکت در زمینه های مختلف به صورت Real Time در اختیار مدیریت قرار بگیرد. خروجی تمام زیر سیستمهای شرکت باید در یک داشبورد حرفه ای جای داده شود. اگر سازمان یا شرکتی بتواند این سیستها را پیاده سازی کند و چنین داشبوردی درست کند میتواند ادعا کند که هوش تجاری یا BI را در حد توان خودش پیاده سازی کرده است.

دوباره درمورد این موضوع مینویسم. هم نتیجه مطالعه های خودم و هم کارهایی که در شرکت میکنم. موضوع جالبی است امسال سعی میکنم بیشتر مطالب بلاگم را به سه محور کلیدی IT . DATA . Marketing اختصاص بدم.

نقش کلیدی دیتا در کسب وکار

پ ن : قبل از شروع به مطالعه این پست بهتر است هوش تجاری را مطالعه کنید.

موانع هوشمند شدن سازمان

ما میدانیم که استفاده کردن از دیتا برای گرفتن تصمیمات بهتر میتواند موجب پیشرفت کسب و کار ما شود و در هر لحظه به ما کمک میکند که تصمیمات بهتری بگیریم. در واقع تصمیمات کنونی ما بیشتر متکی به تجربه مدیریت و یا هوا و هوس و ناشی از احساسات ماست. اینکه رییس یک مجموعه دیشب شام چه غذایی خورده و یا فلان مدیر با همسر و فرزندانش مشکل داشته یا نه ، میتواند روی تصمیمات حیاتی شرکت تاثیر بگذارد. هدف ما به عنوان علاقه مندان تحلیل و هوش تجاری این است که نقش علم و داده را در تصمیمات مدیریتی و بازاریابی شرکت پر رنگ کنیم ما نیاز به یک Vision شفاف و برنامه ریزی شده داریم تا هنر و علم را در کنار هم قرار دهد هنر مدیریت و علم مدیریت.

ما ابتدا شاخص های عملکرد سازمان خود را مورد بررسی قرار میدهیم و سوالاتی که جوابشان برایمان ارزشمند است پیدا میکنیم. مثلا در ۵ سال گذشته خرید تجهیزات شبکه در چه ماهی کمتر از بقیه بوده و یا بر اساس بازپرداخت مشتریان هر مشتری تا چه سقفی میتواند به صورت غیر نقدی جنس بخرد یا اعتبار دارد . و یا چطور مشتریان را تفکیک کنیم ؟ با طبقه بندی داده ها و تمیز کردن آن ما داده های ناقص و یا اطلاعات مشتریانی که فوت کرده اند! ویا هر داده ی بدرد نخور دیگر  را کنار میگذاریم.

یکی از مشکلاتی که سازمانهای ما دارند وجود دیتابیس های مختلف از نرم افزارهای مختلف است مثلا سیستم حسابداری ما ربطی به سیستم ارتباط با مشتری ندارد و یا سیستم حضور و غیاب جدا از سیستم حقوق و دستمزد است در واقع همه ی این سیستمها توسط برنامه نویسان طراحی شده و به خوبی کار میکند ولی مفت هم نمی ارزد در اینجا  گفتم که صرف کد نوشتن برای یک مهندس نرم افزار کفایت نمیکند و نقش یک تحلیل گر سیستم یا یک مهندس IT بسیار پر رنگ تر  و بالاتر است.

در سازمان ما به سیستمهای یکپارچه نیاز داریم تا همه ی داده های ورودی شرکت را به دقت اندازه گیری کند و مدیر بازاریابی یا مدیر عامل بتواند بر آن اساس تصمیم بگیرد. بگذارید صریح تر صحبت کنم وظیفه اصلی سیستم های نرم افزاری جمع آوری داده های ارزشمند و تصمیم گیری بر اساس گزارش ها و تحلیل های آن است. اما کسب و کارها متاسفانه فکر میکنند که کار یک نرم افزار مالی صرفا ارایه ترازنامه به دارایی بررسی سود و زیان سالانه شرکت و یا محاسبه حق بیمه و دستمزد و … است. طنز ماجرا این است که سیستمهای مالی ما شبیه نگرش کوتاه مدت ما در کشور یکساله است و بعد از یک سال تمام داده های مالی از دسترس خارج شده و شما نمیتوانید یک گزارش ۵ ساله از داده های خود یا ۱۰ ساله بگیرید یعنی یک شرکت با ۲۰ سال سابقه فقط روی سال جاری متمرکز است و همان داده ها را هم به صورت Real Time در اختیار دارد.

مشکل دیگر سیستم های نرم افزاری ضعف در ورود اطلاعات است به عنوان مثال برنامه نویس صرفا به دلیل راحتی کار خودو یا فشار کارفرمای ناآگاه فرم هایی را درست میکند که تمام فیلدهای آن را با Text میشود پر کرد و کاربر تنبل هم مثلا به جای آدرس ایمیل مشتری عبارت “۱۱۱۱۱۱” را وارد میکند در واقع همه ی ما دست در دست هم تلاش کرده ایم که سیستم نرم افزاری را دور بزنیم و آن را ناکارمد کنیم از مدیر پروژه بگیرید تا کاربر نهایی که فرم ورود اطلاعات را به سخره گرفته است.

البته اشتباه نکنید سیستم کار میکند نرم افزار بدون ایراد ۱۰ سال است که کار میکند ولی به جای اینکه داده ی قابل اتکا و قابل تحلیل تولید کند یک مشت آشغال تولید میکند یک ماشین عجیب و غریب درست کرده ایم که مشود در باک آن هم آب ریخت هم نفت و هم بنزین سوپر هر جور داده ی مزخرفی را قبول میکند و کنترل ورودی ندارد و معلوم است که خروجی آن هم آشغال خواهد بود به این شکل کسی که در کشور ما تلاش میکند که با دیتای یک کسب و کار تحلیل کند ناچار است بیشتر زمان خود را به تمیز کردن این آشغال ها تلف کند و جالب این است که به نظر همه ی  متخصصان چنین سیستمی بدون ایراد است و خوب کار میکند!

نمیخواهم زیاد خسته تان کنم و در جمع بندی این بخش باید بگویم که چهار ضعف بزرگ مانع تحلیل داده های کسب و کار شده است.

  1. جزیره ای بودن نرم افزارها در سازمان
  2. ضعف نرم افزارها در فرم های ورود اطلاعات
  3. پیوسته نبودن نرم افزار در بازه های بیشتر از یک سال
  4. ناآگاهی کاربران از اهمیت داده

پ ن : اینهایی که گفتم و باز هم میگم مانع نمیشود که ما کار نکنیم و دست روی دست بگذاریم بلکه باید با صبر و حوصله موانع را کنار زده و دیتای تجاری خود را تحلیل کنیم که بعدا شرح کاری که میخواهم بکنم در اینجا مینویسم.

 

خوشه بندی مشتریان و الگوی RFM

خوشه بندی داده ها به زبان ساده یعنی داده های همگن و مشابه را کنار هم بگذاریم. به عنوان مثال رفتار خرید مشتریان میتواند به ما در خوشه بندی مشتریان کمک کند. رفتار مشتریان را میتوان بر اساس سه پارامتر اصلی زیر بررسی کرد که به اصطلاح RFM می گویند.

تازگی (Recency) : این پارامتر از جنس Date می باشد و به آخرین زمان خرید مشتری اشاره میکند. از لحاظ تئوری مشتریانی که تازه خرید کرده اند احتمال اینکه دوباره خرید کنند زیاد است و گزینه مناسبی برای ارایه ی پیشنهادهای فروش میباشند.

تکرار (Frequency) : تعداد دفعاتی که هر مشتری در یک بازه زمانی مشخص خرید میکند و معمولا خریداران با تکراربیشتر مشتریان راضی تری به نظر میرسند.

مقدار پول (Monetary): میزان هزینه ای که مشتری در یک بازه زمانی مشخص پرداخت میکند را بیان میکند.

حال میتوانیم به نسبت نوع سازمان و استراتژی سازمان به هر یک از پارامترهای فوق وزن بدهیم و به این شکل میتوانیم مشتریان خود را جهت اعمال سیاستهای تشویقی و تخفیف و … خوشه بندی کنیم. قبل از شروع مباحث فنی و کار با داده ها باید ابتدا شاخص های کلیدی سازمان خود را تشخیص دهیم.

 

هوش تجاری یا Business Intelligence

پ ن : میخواهم مطالعات و کارهایی که در زمینه BI انجام خواهم داد یا میخواهم انجام دهم اینجا بنویسم.

هوش تجاری قسمت اول

Business Intelligence for Dummies

مقدمه:

مشغول خواندن کتاب Business Intelligence for dummies هستم این کتاب جدیدی نیست و در سال ۲۰۰۸ چاپ شده  ولی برای فهمیدن اینکه BI چیست و البته چه چیزی نیست شروع خوبیه.

فکر میکنم Data Mining – Big Data و BI در آینده و حتی در حال حاضر نقش تعیین کننده ای در کسب و کار ما خواهد داشت در واقع حجم داده ها روز به روز در حال زیاد شدن است و کشور یا شرکت یا شخصی که بتواند از داده های خود به نحو احسن استفاده کند و بر اساس آن تصمیم گیری کند سریعتر و مطمئن تر رشد خواهد کرد.

فرض کنید که شرکتی ادعا کند ۱۵ سال تجربه دارد به نظرم سریعا باید از او پرسید تجربه ات کجاست! آن را مکتوب کرده ای یا داده ی ارزشمندی در این ۱۵ سال جمع کرده ای که بر آن اساس تصمیم بگیری ؟ یا نه؟ که اگر این کار را نکرده باشد باید به تجارب او شک کرد چرا که تجربه های تجاری  وقتی به داده و آنالیز تبدیل نشود مفت هم نمی ارزد. شما بگویید ۱۰۰ سال تجربه چه ارزشی دارد؟ مگر ایران و مصر  بیش از ۳۰۰۰ سال تمدن ندارند آیا از تجربه گذشته خود یا از داده ی خود استفاده کرده اند؟

داشتم میگفتم که داده ها با سرعت سرسام آوری رشد میکنند در کشور ما متاسفانه به این امر توجه نمیشود و کسب و کارهای کوچک و بزرگ داده های با ارزشی ندارند یا آن را جمع نمی کننند و یا بلد نیستند از آن اسفاده کنند. به نظرم یکی از قدمهای اساسی و کارهای ضروری یک کسب و کار جمع آوری داده است یعنی باید از روز اول کلیه تماس های ورودی و خروجی شرکت هزینه ها و درآمدها – رفت و آمدها ی شرکت میزان کارایی افراد و هر موردی که به ذهنشان میرسد ثبت کنند. این داده ها بعد از ۴ یا ۵  سال تبدیل به Wisdom یا خرد یا عقل شرکت میشوند. شرکت در این حالت به قدیمی ترین عضو خود به مدیر عامل و به هیچ کسی وابسته نیست بلکه شرکت یک مغز کامل با تمام داده های لازم است که میتوان بهترین تصمیمات را بر اساس آن گرفت و در تاریکی راه خود را پیدا کند.

وقتی ما از داده حرف میزنیم معمولا همه یاد گوگل وفیس بوک می افتند و میگویند داده چه ربطی به ما دارد و اساسا دیتای زیادی در ایران یا در سرورهای شرکت وجود ندارد و این کارها برای شرکتهای بزرگ خوب است. ولی به نظرم این طور نیست و یک مغازه کوچک هم میتواند از داده به نفع کسب و کار خود استفاده کند.

  • رستوران فست فودی که میداند در روزهای تعطیل متوسط چند نان باگت مصرف میکند و نانهایش کهنه نمیشود.
  • مغازه خیاطی که با حساب و کتاب پی میبرد در چه فصلی از سال و برای چه مدت نیاز به شاگرد خیاطی یا همکار دارد.
  • شرکت نرم افزاری که میداند فقط ۱۰ درصد از مشتریانش از طریق تبلیغات چاپی مشتری شده اند
  • فروشگاه کامپیوتری که میداند ۹۰ درصد کسانی که لپ تاپ میخرند به طور میانگین ۴۵۰۰۰ تومان هم برای لوازم جانبی هزینه میکنند
  • رستورانی که میداند ۷۰ درصد مشتریانش اضافه وزن دارد و میتواند غذاهای رژیمی هم در آنجا بفروشد.

میشود هزاران مثال آورد که از Data برای تصمیم گیری بهتر استفاده کرد و همه ی این مثالها کسب و کارهای کوچکی هستند با داده های خیلی کم ولی میتوانند از همین جا شروع کنند و رشد کنند و تصمیمات بهتری بگیرند.

ساده ترین تعریف ممکن از هوش تجاری شاید یک جمله از کتاب باشد که میگوید:

Using data about yesterday and today to make better decisions about tomorrow

هر کسب و کاری ممکن است در حال حاضر نرم افزارهای مختلفی داشته باشد ممکن است از Excel استفاده کنند و یا از نرم افزارهای اداری و مالی و مختلف که دیتابیس آن MS SQL یا Oracle یا غیره است یا حتی ممکن است کسب و کاری هم داده های خود را در دفتر و سررسیدی کهنه بنویسد که البته برای استفاده از آن باید حتما آن را تبدیل به داده ی دیجیتال کرد و آن در کامپیوتر ذخیره کرد به قول بیل گیتس در کتاب کسب و کار دیجیتال هر داد ه ای که تبدیل به کاغذ شود مرگ آن فرا میرسد. 

نرم افزارهای مختلفی برای استفاده از داده ها و آنالیز آنها توصیه شده که میتوان به مهمترینشان یعنی:

 ….., Rapidminer , Power BI , Tableau

اشاره کرد. البته این نرم افزارها محدودیت هایی هم دارد مثلا Rapidminer تنها تا ۱۰ هزار رکورد را میتواند بخواند که عدد کمی برای کسب و کارهای کوچک نیست. اکثر این نرم افزارها قابیلت وصل شدن به پایگاه داده های مختلف ویا فایلهای Excel و … را دارند که اگر جلوتر رفتیم نمونه هایی را برایتان مثال میزنم .

شکل زیر تصویری از Data Warehouse را نشان می دهد در واقع یک انبار Data بزرگ که از منابع مختلفی به وجود آمده و به مدیریت سازمان برای تصمیم گیری بهتر کمک میکند.

ضعف BI و قانون (GIGO  (Garbage in, Garbage out !

تصور کنید که ما تصمیماتی ر ابر اساس داد های اشتباه یا یک گزارش نادرست بگیرم شاید این تصمیم چون قاطعانه و به پشتوانه BI گرفته شده میتواند موجودیت شرکت را کاملا به خطر اندازد یعنی هیچ کاری نکردن و باری به هر جهتی و جهادی کار کردن خیلی بهتر از یک سیستم BI ناقص یا مشکل دار است. و این جا جایی است که انتظار میرود تحلیل و داده ای درست به وجود بیاید که بتوان به آن تکیه کرد. یعنی بدون دقت کافی نتایج BI از هیچ هم بی ارزش تر است چون لااقل هیچ کاری نکردن و منفعل بودن شرکت را به بیراهه نمی برد.

 ۴ فاکتور کلیدی در BI را میتوان به ترتیب: ۱٫دقت ۲٫ عملی بودن ۳٫ محدودیت زمانی ۴٫ ارزش بالا

نام برد که در بخش بعدی سعی میکنم اینها را هم توضیح بدهم.

پ ن: در نقشه یادگیری  در سایت نوشته ام که میخواهم یادگیری BI را جدی بگیرم به دو دلیل اول اینکه فکر میکنم نقش مهمی در آینده خواهد داشت و دوم اینکه چون ترکیب بیزنس و IT است و من به هر دوی این موضوعات علاقه دارم میتواند فیلد مناسبی برای مطالعه و کارم باشد و به قول معروف از بررسی و موشکافی آن خسته نمیشوم. البته باور دارم که دانستن و عمل نکردن همان ندانستن است و به طور قطع چیزهایی که یاد خواهم گرفت در کسب و کارم و در شرکت قدم به قدم و با حوصله و دقت پیاده خواهم کرد.

 پ ن ۲۳ تیر ۹۶ : با عرض پوزش از دوستان هیچ ایده ای برای ادامه دادن این بحث به شکل فعلی ندارم ولی اگر در خلال کارها و مطالعه هایم در این زمینه چیز جالبی به ذهنم خطور کرد برایتان می نویسم.