Google Cloud ने BigQuery हिस्ट्री-बेस्ड ऑप्टिमाइजेशन की सामान्य उपलब्धता की घोषणा की है, जो क्वेरी परफॉर्मेंस को 100 गुना तक तेज कर सकता है। यह नया फीचर पिछले क्वेरी एक्जीक्यूशन से सीखने और अतिरिक्त सुधारों की पहचान करने के लिए डिज़ाइन किया गया है जिन्हें भविष्य के एक्जीक्यूशन पर लागू किया जा सकता है।
BigQuery हिस्ट्री-बेस्ड ऑप्टिमाइजेशन का एक दिलचस्प पहलू विभिन्न प्रकार की क्वेरी में सुधार करने की क्षमता है, जिसमें वे भी शामिल हैं जिनमें अत्यधिक चयनात्मक जॉइन शामिल हैं। उदाहरण के लिए, यदि BigQuery एक ऐसे जॉइन की पहचान करता है जिसके परिणामस्वरूप उसके इनपुट की तुलना में बहुत कम संख्या में पंक्तियाँ होती हैं, तो वह एक्जीक्यूशन प्लान में उस जॉइन को पहले चलाना चुन सकता है। इससे प्रोसेस किए जाने वाले डेटा की मात्रा में उल्लेखनीय रूप से कमी आ सकती है, जिससे समग्र प्रदर्शन में सुधार होता है।
इसके अलावा, BigQuery हिस्ट्री-बेस्ड ऑप्टिमाइजेशन पूरी क्वेरी में चयनात्मक सेमी-जॉइन ऑपरेशन डालकर BigQuery द्वारा स्कैन किए जाने वाले डेटा की मात्रा को कम करने में मदद कर सकता है। कुछ मामलों में, BigQuery एक अत्यधिक चयनात्मक जॉइन (जॉइन पुशडाउन के समान) की पहचान एक ऐसी क्वेरी में कर सकता है जिसमें कई समानांतर निष्पादन पथ होते हैं जो अंततः एक साथ जुड़ जाते हैं। BigQuery तब चयनात्मक जॉइन के आधार पर नए “सेमिजॉइन” ऑपरेशन डाल सकता है जो उन समानांतर निष्पादन पथों द्वारा स्कैन और संसाधित किए गए डेटा की मात्रा को “कम” करता है।
कुल मिलाकर, BigQuery हिस्ट्री-बेस्ड ऑप्टिमाइजेशन BigQuery के लिए एक मूल्यवान अतिरिक्त है। पिछले क्वेरी एक्जीक्यूशन से ऐतिहासिक डेटा का लाभ उठाकर, यह नया फीचर क्वेरी परफॉर्मेंस में उल्लेखनीय रूप से सुधार कर सकता है और लागत को कम कर सकता है। इसके अलावा, चूंकि यह स्वचालित रूप से काम करता है, इसलिए उपयोगकर्ता अपनी क्वेरी में कोई बदलाव किए बिना इन सुधारों का लाभ उठा सकते हैं।