داده کاوی و کاربرد آن در حسابداری
در طول سالیان اخیر با افزایش حجم اطلاعات مفاهیم جدیدی تحت عنوان سیستمهای اطلاعاتی و بیگ دیتا مطرح گردیدند.
با وجود شبکه جهانی وب، سیستمهای یکپارچه اطلاعاتی، سیستمهای یکپارچه بانکی و … لحظه به لحظه بر حجم اطلاعات افزوده میشود.
بر این اساس ضرورت کشف و استخراج سریع و دقیق اطلاعات از این پایگاههای داده بیش از بیش نمایان شده است.
در حال حاضر داده کاوی مهمترین فناوری برای بهرهوری موثر، سریع و صحیح از دادههای حجیم است.
داده کاوی فرایند پیچیده جهت شناسایی الگوها و مدلهای صحیح، جدید و به صورت بالقوه مفید در حجم وسیعی از دادهها بوده به طریقی که برای انسان قابل درک باشد.
از مشهورترین کاربرد دادهکاوی هوشمندسازی کسبوکار است. در این راستا قابلیتهای دادهکاوی منجر به استفاده از این ابزار در امور مالی و حسابداری گردیدهاست.
امروزه داده کاوی و ابزارهای آن از اهمیت ویژهای در امور مالی و حسابداری برخوردار است.
طبقهبندی و تواناییهای پیشبینی این ابزارها باعث میشود که دادهکاوی به عنوان روشی جهت
- پیش بینی ورشکستگی
- نابسامانی مالی
- تشخیص کلاهبرداری مدیریتی
- برآورد ریسک
- و پیش بینی عملکرد شرکت
استفاده شوند.
داده کاوی چیست؟
«داده کاوی» ترجمه ی عبارت «Data Mining» و به معنای «کاویدن معادن داده» است.
داده کاوی یعنی استخراج اطلاعات ارزشمند از حجم عظیم معادن داده! کلمه ی Mining در معنای تحت الفظی خود یعنی «استخراج از معدن» بکار می رود.
عبارت Data Mining نشان میدهد که حجم انبوه داده همانند یک معدن عمل کرده و از ظاهر آن عناصر ارزشمند درون آن مشخص نیست.

مراحل داده کاوی
مراحل پیاده سازی داده کاوی را میتوان به صورت خلاصه در 10 مرحله بیان کرد:
- شناسايي هدف: در اين مرحله مشخص ميشود كاربر چه چيزي را ميخواهد و تا چه سطحي از اطلاعات را در نظر دارد تا از پايگاه داده، اخذ نمايد.
- انتخاب دادهها: در اين مرحله بايد دادهها بر مبناي معيارهاي مشخص انتخاب گردند.
- آمادهسازي دادهها: شكل قابل استفاده داده و شناسايي متغيرهاي زائد وظيفه اين مرحله از فرآيند خواهد بود.
- ارزيابي دادهها: چارچوب كلي اين مرحله، معيارهايي از قبيل نوع توزيع دادهها، ويژگيها و ساختار پايگاه داده و شرايط كلي دادهها و… است.
- قالببندي پاسخ : خروجي اين بخش، ارائه فرمت به شكل تصوير، نمودار، شبكه عصبي و… است.
- انتخاب ابزار: در اين مرحله ابزارهاي مناسب براي داده كاوي انتخاب ميگردد.
- الگوسازي: فرآيند داده كاوي به صورت واقعی از اين مرحله آغاز ميگردد كه شامل جستجوي الگوها در مجموعه داده، طبقهبندي و ارزشيابي دادهها و… است.
- اعتبارسنجی يافتهها: اين مرحله، شامل آزمون كردن الگوها است.
- ارائه نتايج: نتيجه اين بخش، گزارش نهايي براي كاربر است.
- استفاده از نتايج: هدف اصلي داده كاوي استفاده از نتايج كشف شده براى تصميمگيري، سياست گذاري و پيشبيني به منظور ايجاد يك موقعيت بهتر و جديد است.
چرا داده کاوی سودآور است؟
داده کاوی به دو دلیل سودآور است:
- منجر به تصمیمات واقع بینانه میشود.
- سبب تکرار تصمیمات سودآور رخ داده در گذشته میگردد.
با داده کاوی تصمیمات احساسی را کنار زده شده و تصمیمات بر اساس واقعیتها گرفته میشوند.
بنابراین ضرر های ناشی از نا آگاهی مدیران حذف خواهد شد. شرکتها و سازمانها هر لحظه در حال اتخاذ تصمیمات جدیدی هستند که منجر به سود یا زیان آن مجموعه می شود.
بسیاری از تصمیمات بر اساس واقعیات موجود گرفته نمیشود و عواملی چون:
- فراموشی
- تخلفات و تقلبات
- منافع شخصی
- و سیاستهای اعمال نفوذ شده
منجر به اتخاذ تصمیمات غیر شفاف و در نتیجه زیان بار میشوند.
داده کاوی چگونه کار می کند؟
داده کاوی به عنوان یک فرایند ترکیبی، مجموعهای از روشها و تکنیکهاست که برای تحلیلهای گوناگون به کار میرود و میتواند پاسخگوی طیف وسیعی از نیازهای یک کسبوکار باشد.
در داده کاوی از الگوریتمها و شیوههای مختلفی استفاده میشود که برخی از آنها عبارتند از:
- مدلسازی توصیفی: آشکارسازی موارد مشابه یا گروههای مشترک در دادههای موجود، با هدف تشخیص دلایل موفقیت یا شکست
- مدلسازی پیشبینانه: این مدل به گونهای عمیقتر، به دستهبندی رویدادها در آینده میپردازد و میکوشد نتایج ناشناخته را پیشاپیش برآورد کند.
- مدلسازی تجویزی: پا به پای رشد دادههای بدون ساختار در وب، فیلدهای اظهار نظر، کتابها و … متن کاوی (text mining) نیز که یکی از شاخههای داده کاوی محسوب میشود، افزایش قابل توجهی داشته است.
وظیفه داده کاوی کاویدن و استخراج از منابع عظیم داده و بانکهای اطلاعاتی است تا اطلاعات گرانبهای موجود در حجم عظیمی از اطلاعات سطحی پنهان شده استخراج کند.
برخی از صاحب نظران بر اساس مفاهیم موجود معتقداند این فناوری تنها مرحلهای از فرایندی فراگیرتر به نام کشف دانش در پایگاه داده است.
مراحل دیگر در این فرایند شامل:
- پاکسازی
- یکپارچهسازی
- انتخاب داده
- تبدیل و ارزیابی الگو
است.
داده کاوی و حسابداری
اطلاعات مالی توسط نهادهایی همچون:
- بانکها و موسسات اعتباری
- تحلیلگران بورس و اوراق بهادار
- ممیزان مالیاتی
- حسابداران بزرگ
- و حسابرسان تخصصی
جمعآوری میشود. روشهای داده کاوی در دادههای مالی میتواند در حل مشکلات طبقهبندی، پیشبینی و تسهیل فرآیند تصمیمگیری به کار رود.
اهمیت داده کاوی در حسابداری در بسیاری از سازمانها مشاهده میشود. جامعه حسابداران رسمی امریکا این دانش را به عنوان یکی از ده روش برتر برای اینده تعریف کردهاست.
و انجمن حسابرسان داخلی امریکا نیز این فناوری را به عنوان یکی از چهار تحقیق برتر این رشته معرفی کرده است.
حوزه کاربردی داده کاوی در حسابداری و امور مالی
در دنياي تجارت نيز دادههاي مالي به عنوان سرمايه راهبرد مطرح هستند.
دادههاي مالي توسط موسساتي مثل بانكها، بورس اوراق بهادار، سازمانهاي مالياتي، پايگاههاي داده ويژه حسابرسان و حسابداران و … جمع آوري و نگهداري ميشوند.
روشهاى داده كاوي در دادههاي مالي، میتواند در حل مشكلات طبقهبندي و پيشبيني و تسهيل فرآيند تصميمگيري به كار رود.
نمونههايي ازمسائل طبقهبندي مالي شامل: ورشكستگي شركتها، تخمين ريسك اعتباري، گزارش تداوم فعاليت، درماندگى مالي و پيشبيني عملكرد واحد تجاري است.
به اين ترتيب دامنه اهميت داده كاوي در امور مالي و حسابداري ميتواند طيفى گسترده از كشف تقلب تا افزايش سودآوري واحدهای تجاري باشد.
الف) پیشبینی ورشکستگی
این حوزه یکی از پرکاربردترین موارد استفاده داده کاوی در اطلاعات مالی محسوب میشود.
ورشکستگی شرکت باعث خسارات اقتصادی به مدیران، سرمایهگذاران، وام دهندگان و … خواهد شد و همچنین هزینههای اجتماعی زیادی در پیش دارد.
بر این اساس پیشبینی ورشکستگی یکی از مسائل مهم در امور مالی و حسابداری محسوب میشود.
استفاده از ابزارهای داده محور جهت بررسی صورتهای مالی و ارسال سیگنالهای هشدار در مواقع مورد نیاز میتواند اگاهی بخش مسئولین مربوطه باشد.

رويكردهاي آماري مانند تحليل تشخيصي و تحليل لاجيت و پروبيت و همچنين رويكرد فنون هوشمند محاسباتي شامل سيستمهاي خبره، شبكههاي عصبي مصنوعي و… در فرآيند پيشبينى ورشكستگي شركتها قابل استفاده هستند.
اغلب تحقيقات پيشبيني ورشكستگى، عملكرد هر يك روشهاي فوق را مقايسه ميكنند.
اما به طور قطعى نميتوان اظهار داشت كه كدام يك از اين روشها، از دقت كلى بيشترى در مقايسه
با ساير روشها برخوردار است.
ب) تداوم فعاليت و مضيقه مالي
رسواييهايي حسابرسي در سالهاي اخير، اهميت تجزيه و تحليلهاى حسابرسيهاى كامل را دو چندان ساخته است.
براساس استاندارد حسابرسي شماره 59 حسابرس بايد توانايي صاحبكار را در مورد امكان ادامه فعاليت حداقل يك سال بعد از تاريخ ترازنامه ارزيابي كند.
چنانچه نشانههايي از وجود مشكلات مالي ديده شود كه احتمالا منجر به ورشكستگي خواهد شد، حسابرس میبايد در خصوص تداوم فعاليت صاحبكار اظهارنظر كند.
ارزيابي وضعيت تداوم فعاليت شركتها كار چندان سادهاي نيست.
مطالعات نشان ميدهند بخشی نسبتاً كوچك از واحدهاي تجاري ورشكسته، واجد شرايط مبناي تداوم فعاليت هستند.
جهت تسهیل وظيفه حسابرسان و وظايف آنها در مورد وضعيت تداوم فعاليت شركتها، روشهاي آماري و يادگيري ماشين پيشنهاد شدهاند.
ج) تقلب مدیریت
تحقیقات نشان داده است که پیشبینی تقلب تقریبا غیر ممکن است. در واقع بسیاری از خصوصیات و ویژگیهای مرتبط با جرم کارمندی دقیقا همانهایی هستند که سازمانها به هنگام استخدام کارمندان خود در جست و جوی آنها هستند.
تقلب مدیریت تقلبی فراگیر است که مدیریت به واسطهی تحریف صورتها و اطلاعات مالی مرتکب میشود.
تقلب مدیریت میتواند منافع مسئولیت مالیاتی، سرمایه گذاران و وام دهندگان را با مخاطره مواجه کند.
استفاده از داده کاوی به جهت کشف روندهای موجود در دادههای دستکاری شده و کشف انها کمک شایانی در جهت کشف این گونه تقلبها ارائه داده است.
د) پیشبینی عملکرد واحد تجاری
با وجود چالشهای ناشی از تفکیک مالکیت از مدیریت و تضاد منافع میان گروههای ذینفع، از ابزارهایی حسابداری همچون:
- سود هر سهم
- نسبت بازدهی حقوق صاحبان سهام
- بازدهی سرمایهگذاری
- و …
به منظور بررسی عملکرد یک واحد تجاری استفاده میشود. (اشنایی با نسبهای مالی و کاربرد انها)
در این راستا مدلهای متفاوتی در جهت بررسی و تجزیه و تحلیل عملکرد با توجه به گزارشهای ارسالی به مدیران و اطلاعات مالی شرکت مبتنی بر داده کاوی و متن کاوی توسعه یافته است.
ه) ارزیابی ریسک اعتباری
تجزیه و تحلیل ریسک اعتباری به واسطه افزایش تعداد شرکتهای ورشکسته و پیشنهادهای رقابتی وام دهندگان، تبدیل به یکی از محبوب ترین حوزههای مالی گردیده است.
در این راستا روشهای داده کاوی به منظور تسهیل پیشبینی ریسک اعتباری میتواند به کار برده شود.
استفاده از شبکههای عصبی، مطالعه ماشین و ماشین بردار پشتیبان در این راستا رایج است.
آینده داده کاوی و حسابداری
اگرچه تعداد زيادى از تحقيقات در ارتباط با كاربرد روشهاي داده كاوي در امور مالي بودهاند، اما حوزههاي مستعد ديگري به منظور گسترش دامنه تحقيقات وجود دارند.
معرفي مدلهاي تركيبي، بهبود مدلهاي كنوني، استخراج قواعدي جامع از شبكههاي عصبي مصنوعي، بهسازي و يكپارچهسازي سيستمهاي ERP با ابزارهاي داده كاوي ميتوانند گسترهاي نوين و متفاوت از تحقيقات داده كاوي باشند.
- ارزيابي هزينههاي منتسب به خطاهاي نوع اول و دوم
- توسعه بردار ورودي به وسيله اطلاعات كيفي
- بهره برداري از روشهاي معتبر انتخاب ويژگى
ميتوانند از جمله ساير روشهاي تحقيق در حوزه داده كاوي در آينده باشند.
بدين ترتيب با ارتقاي مدلها و روشهاي مورد استفاده، ميتوان تبديل شدن داده كاوي به ابزاري مفيدتر در فرآيند تصميمگيري به خصوص در حوزههاى مالى را، به نظاره نشست.