Google क्लाउड ने 429 "संसाधन समाप्ति" त्रुटियों को संभालने के बारे में एक गाइड प्रकाशित किया है, खासकर बड़े भाषा मॉडल (LLM) के साथ काम करते समय। लेख में LLM की पर्याप्त कम्प्यूटेशनल मांगों को देखते हुए, एक सहज उपयोगकर्ता अनुभव के लिए संसाधन खपत के प्रबंधन पर जोर दिया गया है। यह तीन प्रमुख रणनीतियाँ प्रस्तुत करता है:

1. **बैकऑफ़ और पुनः प्रयास:** संसाधन समाप्ति या API अनुपलब्धता को संभालने के लिए घातीय बैकऑफ़ और पुनः प्रयास तर्क लागू करें। प्रतीक्षा समय प्रत्येक पुनः प्रयास के साथ तेजी से बढ़ता जाता है जब तक कि अतिभारित सिस्टम ठीक नहीं हो जाता।

2. **गतिशील साझा कोटा:** Google क्लाउड अनुरोध करने वाले उपयोगकर्ताओं के बीच उपलब्ध क्षमता को गतिशील रूप से वितरित करके कुछ मॉडलों के लिए संसाधन आवंटन का प्रबंधन करता है। यह दक्षता में सुधार करता है और विलंबता को कम करता है।

3. **प्रोविज़नड थ्रूपुट:** यह सेवा आपको Vertex AI पर जनरेटिव AI मॉडल के लिए समर्पित क्षमता आरक्षित करने देती है, जिससे पीक डिमांड के दौरान भी अनुमानित प्रदर्शन सुनहारित होता है।

लेख में बैकऑफ़/पुनः प्रयास को गतिशील साझा कोटा के साथ संयोजित करने पर प्रकाश डाला गया है, खासकर जैसे-जैसे अनुरोध की मात्रा और टोकन का आकार बढ़ता है। LLM एप्लिकेशन लचीलापन के लिए उपभोक्ता कोटा ओवरराइड और प्रोविज़नड थ्रूपुट जैसे अन्य विकल्पों का उल्लेख किया गया है। यह GitHub पर Vertex AI नमूनों का उपयोग करके या Google क्लाउड के शुरुआती गाइड, क्विकस्टार्ट या स्टार्टर पैक का लाभ उठाकर जनरेटिव AI के साथ निर्माण को प्रोत्साहित करता है।