डाटा व्रान्गलिन Data Science की फील्ड में एक important प्रोसेस है|  Data Wrangling का उद्देश्य है की एक तऱह के डाटा को कई तरह के conventional analysis के लिए उपयोग किया जा सके| Data Wrangling किसी data को उसके raw format से किसी दूसरे valuable form बदलने की एक प्रोसेस है| Data wrangling दो डाटा के बिच mapping को बताता है मतलब एक data को दूसरे form में कन्वर्ट करने की प्रोसेस को भी बताता है |

इसमें एक Data Wrangler होता है जो raw डाटा पर transformation operations को परफॉर्म करता है| यह data wrangler एक person भी हो सकता हैया कोई सॉफ्टवेयर टूल भी |

Data Wrangling कई तरह की चीजों के लिए उपयोग किया जाता है  जैसे -

  • Munging के लिए
  • Data Visualization के लिए
  • Data Aggregation के लिए 
  • Statistical Model को train करने के लिए आदि 

इस  प्रोसेस में डाटा कुछ विशेष प्रकार डाटाबेस में store होता है | अगर इसकी एक डेफिनिशन देखे तो

Data wrangling is a process of cleaning, structuring and enriching a raw data into a desired format for better decision making in less time.

Data Wrangling के लिए 6 प्रोसेस है


  1. Discovery 
  2. Structuring
  3. Cleaning
  4. Enriching
  5. Validating
  6. Publishing