ડાયપર અને બીયરનું વેચાણ સંબંધિત છે તે શોધવા માટે એક મોટા સુપરમાર્કેટે ડેટા માઇનિંગનો ઉપયોગ કેવી રીતે કર્યો તે જાણો અને પછી વેચાણ વધારવા માટે ઉત્પાદન મિશ્રણમાં ફેરફાર કર્યો. ડેટા માઇનિંગ કેવી રીતે કામ કરે છે, ડેટા માઇનિંગના વિવિધ પ્રકારો અને તે તમારા માટે શું કરી શકે છે તે અમે વિગતવાર સમજાવીએ છીએ. ડેટા માઇનિંગનો ઉપયોગ માત્ર માર્કેટિંગ જ નહીં પણ ઘણા ક્ષેત્રોમાં થઈ શકે છે અને તે મોટા ડેટાના યુગમાં વધુને વધુ મહત્વપૂર્ણ ભૂમિકા ભજવશે.
તમે L-Mart ના સ્ટોર A ના સ્ટોર મેનેજર છો, જે એક વિશાળ સુપરમાર્કેટ છે. તાજેતરમાં, એક સ્પર્ધક, H-Mart, નજીકમાં ખુલ્યું છે અને તમે ચિંતિત છો કે તમારા સ્ટોરનું વેચાણ નોંધપાત્ર રીતે ઘટી ગયું છે. તમે મુખ્ય મથક પાસેથી મદદ માંગવાનું નક્કી કરો છો. હેડક્વાર્ટર દ્વારા મોકલવામાં આવેલ કર્મચારી સ્ટોરની મુલાકાત લે છે અને તમને ત્રણ મહિનાના વેચાણ ઇતિહાસ મોકલવા માટે કહે છે. થોડા દિવસો પછી, તે તમને સામાનની ગોઠવણી બદલવાની સૂચનાઓ સાથે કાગળનો ટુકડો આપે છે. શું? બેબી ડાયપરની બાજુમાં બીયર? ડાયપરની બાજુમાં બીયર, જે ન તો પેશી છે કે ન તો બાળકોના રમકડાં, તેનો કોઈ સામાન્ય અર્થ નથી. પરંતુ તમે હેડક્વાર્ટરમાં ફરિયાદ કરવા માટે ખૂબ જ ડરપોક છો, તેથી તમે નિર્દેશન મુજબ વસ્તુઓને ફરીથી ગોઠવવાનું નક્કી કરો છો. એક મહિના પછી, જ્યારે તમે તમારું વેચાણ તપાસો છો, ત્યારે તમને ખ્યાલ આવે છે કે જૂઠાણાની જેમ જ બીયરનું વેચાણ નાટકીય રીતે વધ્યું છે.
આ વાસ્તવિક જીવનની વાર્તાનું કાલ્પનિક સંસ્કરણ નથી. ભૂતકાળમાં, યુનાઇટેડ સ્ટેટ્સમાં વોલમાર્ટે ડેટાનું વિશ્લેષણ કર્યું હતું અને જાણવા મળ્યું હતું કે ડાયપર અને બીયરનું વેચાણ સહસંબંધિત છે, એટલે કે બાળકોના પિતા જ્યારે ડાયપર ખરીદતા હતા ત્યારે તેઓ ઘણીવાર બીયર ખરીદતા હતા. તેઓ ડાયપર અને બીયરને એકસાથે મૂકીને આનો લાભ લેવા સક્ષમ હતા, જેના પરિણામે બીયરના વેચાણમાં નોંધપાત્ર વધારો થયો હતો.
ચાલો સ્ટોર A ના ઉદાહરણ પર પાછા જઈએ. મુખ્ય મથકના સ્ટાફને આ સહસંબંધ કેવી રીતે મળ્યો? જવાબ ડેટા માઇનિંગ છે. ડેટા માઇનિંગ એ જોડાણો, સમાનતાઓ, પેટર્ન વગેરેને ઓળખીને મોટી માત્રામાં ડેટામાંથી મૂલ્યવાન માહિતી કાઢવાની પ્રક્રિયા છે. અમે દરરોજ જે ડેટા એકઠા કરીએ છીએ તે ફક્ત તેના પોતાના પર સંખ્યાઓનો ઢગલો છે, અને તેને મૂલ્યવાન બનાવવા માટે "પ્રક્રિયા" કરવાની જરૂર છે. આ માટે એક મૂર્ત સામ્યતા 'જંક આર્ટ' છે. જંક આર્ટ એ છે જ્યારે તમે જંક અથવા કચરામાંથી કલા બનાવો છો. કચરાના ટાયર, સિગારેટના બટ્સ, બોટલ કેપ્સ અને અન્ય કચરાપેટીઓમાંથી સુંદર અને અદભૂત કલાકૃતિઓ બનાવવામાં આવી છે જેને મોટાભાગના લોકો જોતા પણ નથી. જંક કલાકારો આ વસ્તુઓને તેઓ જે રંગ, પોત અને ચમકે શોધી રહ્યાં છે તે હાંસલ કરવા માટે સૉર્ટ કરે છે અને ભેગા કરે છે અને અંતિમ પરિણામ એ કલાનું કાર્ય છે. એ જ રીતે, ઘણા બધા ડેટાનું પોતાનું કોઈ મૂલ્ય હોતું નથી, પરંતુ જ્યારે તેને સૉર્ટ કરવામાં આવે છે અને કેટલાક હેતુ સાથે જોડવામાં આવે છે, ત્યારે કંઈક મૂલ્યવાન બનાવવામાં આવે છે.
ડેટા માઇનિંગના પાંચ મુખ્ય પ્રકારો છે: વર્ગ વર્ણન અને વર્ગ ભેદભાવ, ક્લસ્ટર વિશ્લેષણ, એસોસિએશન વિશ્લેષણ, આઉટલીયર વિશ્લેષણ અને અનુક્રમિક પેટર્ન વિશ્લેષણ. જ્યારે ડેટાના સમૂહને અમુક માપદંડો દ્વારા એકસાથે જૂથબદ્ધ કરવામાં આવે છે ત્યારે તેને વર્ગ કહેવામાં આવે છે, આપેલ માહિતી વસ્તુઓની લાક્ષણિકતાઓ શોધવાને વર્ગ વર્ણન કહેવામાં આવે છે, ડેટાને બે જૂથોમાં વિભાજિત કરી શકે તેવા વિશિષ્ટ લક્ષણો શોધવાને સ્તરીકરણ કહેવામાં આવે છે, ક્લસ્ટર વિશ્લેષણનો ઉપયોગ થાય છે. નવા વર્ગો શોધવા માટે, અને એસોસિએશન વિશ્લેષણનો ઉપયોગ ડેટા જૂથો વચ્ચેની લિંક્સ શોધવા માટે થાય છે. સરેરાશથી નોંધપાત્ર રીતે વિચલિત થતો ડેટા શોધવાને આઉટલીયર એનાલિસિસ કહેવામાં આવે છે અને સમય જતાં વર્તનની પેટર્નનું પૃથ્થકરણ કરવું એ ક્રમિક પેટર્ન વિશ્લેષણ કહેવાય છે.
અમારા ઉદાહરણમાં ઉપયોગમાં લેવાતા ડેટા માઇનિંગનો પ્રકાર એસોસિએશન વિશ્લેષણ છે. એસોસિએશન વિશ્લેષણમાં, એસોસિએશનની ડિગ્રી નક્કી કરવા માટે ત્રણ પગલાંનો ઉપયોગ કરવામાં આવે છે. પ્રથમ 'સપોર્ટ' છે, જે તમામ વ્યવહારોની ટકાવારી છે જ્યાં બે વસ્તુઓ (A અને B) એકસાથે વેપાર થાય છે. બીજું છે “કોન્ફિડન્સ”, જે A ના કુલ વ્યવહારોની ટકાવારી છે જેમાં A અને B એકસાથે સામેલ છે. છેલ્લું 'એન્હાન્સમેન્ટ' છે, જે A અને B ની ટકાવારી છે જે એકસાથે ટ્રેડેડ (આત્મવિશ્વાસ) ની ટકાવારી છે જ્યાં B નો વેપાર થયો હતો. જો ઉન્નત્તિકરણોનું મૂલ્ય 1 હોય, તો તે એકબીજાથી સ્વતંત્ર હોય છે, અને જો તે 1 કરતા વધારે હોય, તો તે હકારાત્મક રીતે સહસંબંધિત હોય છે, અને જો તે 1 કરતા ઓછા હોય, તો તે નકારાત્મક રીતે સહસંબંધિત હોય છે. પ્રથમ, તમામ વસ્તુઓ માટે આધારની ગણતરી કરવામાં આવે છે, અને પછી વિશ્વાસની ગણતરી એવી વસ્તુઓ માટે કરવામાં આવે છે કે જેનું સમર્થન ચોક્કસ સ્તર હોય. ડેટા ખાણિયો નક્કી કરે છે કે સમર્થનનું સ્તર શું હોવું જોઈએ, અને પછી તે વસ્તુઓ માટે વૃદ્ધિની ગણતરી કરે છે જે એકબીજા સાથે કંઈક અંશે સંબંધિત હોવાનું માનવામાં આવે છે તે શોધવા માટે કે તેઓ કેવી રીતે સંબંધિત છે. આ રીતે અમને જાણવા મળ્યું કે ડાયપર અને બીયર એકબીજા સાથે સંબંધિત છે અને હકારાત્મક રીતે સંબંધિત છે.
જ્યારે અમે ફક્ત ચર્ચા કરી છે કે ડેટા માઇનિંગનો ઉપયોગ માર્કેટિંગમાં કેવી રીતે કરી શકાય છે, તે ક્ષેત્રોની વિશાળ શ્રેણીમાં ઉપયોગ કરી શકાય છે. ફાઇનાન્સમાં, તેનો ઉપયોગ ક્રેડિટ સ્કોરિંગ, ક્રેડિટ કાર્ડ ફ્રોડ ડિટેક્શન અને સિક્યોરિટીઝની કિંમતની આગાહી માટે થાય છે; ટેલિકોમ્યુનિકેશન્સમાં, તેનો ઉપયોગ ગ્રાહક મંથન નિવારણ, પાત્ર અને પેટર્નની ઓળખ અને સુરક્ષા વ્યવસ્થાપન માટે થાય છે; આરોગ્યસંભાળમાં, તેનો ઉપયોગ રોગના નિદાન અને આનુવંશિક વિશ્લેષણ માટે થાય છે; ઊર્જામાં, તેનો ઉપયોગ વીજળીની માંગની આગાહી અને સંસાધન સંશોધન માટે થાય છે; અને ઉત્પાદનમાં, તેનો ઉપયોગ નવા ઉત્પાદન/નવી સેવા વિકાસ, ખામીની આગાહી, ફેક્ટરી ઓટોમેશન, ઈન્વેન્ટરી અને માંગ વ્યવસ્થાપન માટે થાય છે. વધુમાં, તેનો ઉપયોગ ભૂતકાળ અથવા વર્તમાન પરિસ્થિતિને સમજવા અથવા આપેલ ડેટામાંથી ભવિષ્યની આગાહી કરવાની રીત તરીકે થઈ શકે છે.
આજકાલ, બિગ ડેટા સમગ્ર વિશ્વમાં ધૂમ મચાવે છે. IT ઉપકરણોના સર્વવ્યાપક ઉપયોગ સાથે, ડેટા સતત જનરેટ થઈ રહ્યો છે. એક આંકડા મુજબ, એકલા 2011 માં, વિશ્વભરમાં લગભગ 2 ટ્રિલિયન જીબી ડેટાનું ઉત્પાદન અને વપરાશ કરવામાં આવ્યો હતો, અને કોરિયામાં 28 અબજ જીબી ડેટાનું ઉત્પાદન અને વપરાશ કરવામાં આવ્યો હતો. આ ડેટાને ફેંકી દેવાને બદલે ઉપયોગી બનાવવા માટે ડેટા માઈનીંગ જરૂરી છે અને ઈન્ટરનેટ આધારિત જીવંત વાતાવરણ ભવિષ્યમાં વધુ વિકસિત થવાની ધારણા હોવાથી ડેટા માઈનીંગનું મહત્વ હજુ વધુ વધવાની અપેક્ષા છે.
ડેટા માઇનિંગનો ઉપયોગ માત્ર વેચાણ વધારવા માટે જ નહીં, પણ ગ્રાહકની ખરીદીની પેટર્નને ઓળખવા, કસ્ટમાઇઝ્ડ માર્કેટિંગ કરવા, ઇન્વેન્ટરી મેનેજમેન્ટ કાર્યક્ષમતામાં સુધારો કરવા અને ગ્રાહક સંતોષને વધારવા માટે વિવિધ વ્યૂહરચના વિકસાવવા માટે પણ થઈ શકે છે. ડેટા એ આધુનિક વિશ્વનું તેલ છે, અને તમે કેટલી સારી રીતે ખાણ અને પ્રક્રિયા કરો છો તે તમારા વ્યવસાયને બનાવી અથવા તોડી શકે છે, તેથી જ ડેટા માઇનિંગના મહત્વને ઓળખવું અને તેનો લાભ લેવો ખૂબ જ મહત્વપૂર્ણ છે.