परिवर्तनीय, बर्स्टी डेटाबेस वर्कलोड — क्षमता की जरूरतें मिनटों के भीतर 10 गुना बढ़ जाती हैं।
→Aurora Serverless v2। न्यूनतम/अधिकतम ACU सेट करें; Aurora कनेक्शन ड्रॉप के बिना सेकंड में स्केल करता है।
क्यों: v2 मौजूदा इंस्टेंस में क्षमता जोड़कर स्केल करता है — कोई फेलओवर नहीं। प्रोविज़ंड Aurora इतनी तेज़ी से स्केल नहीं कर सकता; Serverless v1 धीरे-धीरे स्केल करता है और कनेक्शन को रोक देता है।
संदर्भ↗
क्रॉस-रीजन DB फेलओवर के लिए <1s RPO और <1min RTO के साथ ग्लोबल ऐप।
→Aurora Global Database। स्टोरेज-आधारित प्रतिकृति, विशिष्ट प्रतिकृति अंतराल <1s। सेकंड में सेकेंडरी को बढ़ावा दें।
क्यों: ग्लोबल DB पेज भेजता है, ट्रांजैक्शन नहीं — उप-सेकंड क्रॉस-रीजन। तार्किक प्रतिकृति के माध्यम से क्रॉस-रीजन रीड प्रतिकृतियां इससे मेल नहीं खा सकतीं।
संदर्भ↗
एक पूर्ण कॉपी के लिए भुगतान किए बिना परीक्षण के लिए एक प्रोडक्शन डेटाबेस को दोहराएं।
→Aurora क्लोनिंग। कॉपी-ऑन-राइट — प्रारंभिक क्लोन मुफ्त है; केवल बदले हुए पेज बिल किए जाते हैं।
क्यों: क्लोन पॉइंट-इन-टाइम, इंस्टेंट, आइसोलेटेड होते हैं। स्नैपशॉट+पुनर्स्थापना में घंटे लगते हैं और तुरंत पूर्ण स्टोरेज का बिल आता है।
संदर्भ↗
मिनटों में एक तार्किक त्रुटि (प्रोड में DROP TABLE) से उबरें, घंटों में नहीं।
→Aurora MySQL Backtrack। बैकअप से पुनर्स्थापित किए बिना क्लस्टर को अपनी जगह पर एक पिछले बिंदु पर वापस ले जाता है।
क्यों: Backtrack अपनी जगह पर और तेज़ है। PITR पुनर्स्थापना एक नया क्लस्टर बनाती है — धीमा और ऐप कटओवर की आवश्यकता होती है।
संदर्भ↗
बड़ी मेमोरी वाले विशिष्ट रीडर इंस्टेंस को रिपोर्टिंग क्वेरीज़ रूट करें।
→Aurora कस्टम एंडपॉइंट्स। रीडर्स के एक उपसमूह (बड़े वाले) को इंगित करने वाला एंडपॉइंट परिभाषित करें।
क्यों: डिफ़ॉल्ट रीडर एंडपॉइंट सभी रीडर्स को राउंड-रॉबिन करता है। कस्टम एंडपॉइंट्स वर्कलोड प्रकार द्वारा क्लस्टर को विभाजित करते हैं।
संदर्भ↗
DynamoDB टेबल में हॉट पार्टिशन स्पाइक्स कुछ रीड्स/राइट्स को थ्रॉटल करते हैं।
→ऑटो-स्केलिंग + एडेप्टिव क्षमता (स्वचालित) के साथ प्रोविज़ंड। यदि एक ही कुंजी हॉटस्पॉट है तो पार्टिशन कुंजी को फिर से डिज़ाइन करें।
क्यों: एडेप्टिव क्षमता बिना किसी कार्रवाई के पार्टिशनों में थ्रूपुट को पुनर्वितरित करती है। लेकिन अगर एक कुंजी हॉट है, तो केवल स्कीमा रीडिज़ाइन (कंपोजिट कुंजी, राइट शार्डिंग) मदद करता है।
संदर्भ↗
हर DynamoDB राइट पर साइड-इफ़ेक्ट — सर्च इंडेक्सिंग के लिए OpenSearch पर पुश करें।
→DynamoDB Streams + Lambda ट्रिगर। Lambda स्ट्रीम रिकॉर्ड्स को बैच करता है और OpenSearch पर लिखता है।
क्यों: स्ट्रीम 24 घंटे के लिए आइटम-स्तर के परिवर्तनों को कैप्चर करते हैं। नेटिव ट्रिगर मॉडल — लंबी प्रतिधारण/विश्लेषण के लिए Kinesis Data Streams एडाप्टर मौजूद है।
संदर्भ↗
कई DynamoDB आइटमों में दो-चरण राइट को एटॉमिक होना चाहिए।
→TransactWriteItems / TransactGetItems। 100 आइटम तक ACID सेमांटिक्स।
क्यों: नेटिव ट्रांजैक्शन वितरित-सागा जटिलता से बचते हैं। लागत प्रति आइटम सामान्य क्षमता का 2x है — केवल तभी उपयोग करें जब एटॉमिकिटी की आवश्यकता हो।
संदर्भ↗
एक स्व-होस्टेड MongoDB क्लस्टर को API को संरक्षित करते हुए एक प्रबंधित सेवा में माइग्रेट करें।
→Amazon DocumentDB। MongoDB-संगत API। माइग्रेशन के लिए mongodump/mongorestore या DMS का उपयोग करें।
क्यों: DocumentDB MongoDB 4.0/5.0 (अधिकांश ऑपरेटर, सभी नहीं) के साथ API-संगत है। कमिट करने से पहले ड्राइवर/फीचर संगतता सत्यापित करें।
संदर्भ↗
सिफारिश इंजन को 100M नोड्स के एक सोशल ग्राफ को पार करने की आवश्यकता है।
→Amazon Neptune। प्रॉपर्टी ग्राफ (Gremlin) या RDF (SPARQL)।
क्यों: उद्देश्य-निर्मित ग्राफ DB। DynamoDB या RDS में रिश्तों को मॉडल करना संभव है लेकिन क्वेरी प्रदर्शन हॉप गहराई के साथ घटता है।
संदर्भ↗
IoT फ्लीट प्रति सेकंड 10M टाइम्ससीरीज़ डेटापॉइंट्स उत्सर्जित करता है जिसमें मिश्रित-फ़्रीक्वेंसी प्रतिधारण होता है।
→Amazon Timestream। मेमोरी स्टोर (हाल का), मैग्नेटिक स्टोर (ऐतिहासिक) — स्वचालित टियरिंग।
क्यों: उद्देश्य-निर्मित टाइम्ससीरीज़ — DynamoDB/RDS स्केलिंग इस दर पर लागत prohibitive है। बिल्ट-इन प्रतिधारण टियरिंग स्टोरेज लागत को कम करता है।
संदर्भ↗
बैंकिंग लेज़र को हर रिकॉर्ड परिवर्तन के क्रिप्टोग्राफिक सत्यापन की आवश्यकता है।
→Amazon QLDB। अपरिवर्तनीय, क्रिप्टोग्राफिक रूप से सत्यापन योग्य जर्नल। सबूतों के लिए SHA-256 डाइजेस्ट निर्यात का उपयोग करें।
क्यों: QLDB उद्देश्य-निर्मित लेज़र है। DynamoDB Streams परिवर्तन इतिहास देते हैं लेकिन कोई बिल्ट-इन क्रिप्टोग्राफिक चेनिंग नहीं।
अप्रत्याशित पीक और हैंड्स-ऑफ संचालन के साथ लॉग एनालिटिक्स वर्कलोड।
→Amazon OpenSearch Serverless। डिकपल्ड कंप्यूट/स्टोरेज; ऑटो-स्केल्स OCUs।
क्यों: कोई क्लस्टर साइज़िंग या शार्ड प्रबंधन नहीं। अनुमानित, निरंतर वर्कलोड के लिए, प्रोविज़ंड डोमेन सस्ते होते हैं।
संदर्भ↗
इलास्टिक कंप्यूट और टीमों के बीच डेटा साझाकरण के साथ पेटाबाइट-स्केल एनालिटिक्स।
→प्रबंधित स्टोरेज के साथ Redshift RA3 नोड्स। क्रॉस-क्लस्टर डेटा साझाकरण (कोई कॉपी नहीं)।
क्यों: RA3 कंप्यूट को स्टोरेज से अलग करता है — प्रत्येक को स्वतंत्र रूप से स्केल करें। डेटा साझाकरण टीमों के क्लस्टर के बीच ETL को समाप्त करता है।
संदर्भ↗
मौजूदा Redshift क्लस्टर + S3 डेटा लेक — Redshift से S3 को क्वेरी करें, या Athena का उपयोग करें?
→Redshift Spectrum जब क्लस्टर टेबल और S3 डेटा के बीच जॉइन की आवश्यकता होती है। Athena जब केवल S3 पर पूरी तरह से सर्वरलेस एड-हॉक की आवश्यकता होती है।
क्यों: Spectrum Redshift कंप्यूट के माध्यम से S3 क्वेरीज़ चलाता है। Athena प्रति TB स्कैन पर भुगतान करता है। जहां प्रमुख डेटा रहता है उसके अनुसार चुनें।
संदर्भ↗
विभिन्न टीमों को एक ही Glue Catalog टेबल्स पर विभिन्न पंक्ति/कॉलम दृश्यता की आवश्यकता है।
→पंक्ति-स्तर + कॉलम-स्तर + सेल-स्तर फ़िल्टर के साथ AWS Lake Formation। LF टैग के माध्यम से अनुदान दें।
क्यों: IAM/S3 नीतियां पंक्ति-स्तर नहीं कर सकतीं। Lake Formation Glue Catalog मेटाडेटा + Athena/Redshift Spectrum/EMR उपभोक्ताओं के माध्यम से फाइन-ग्रेन्ड एक्सेस लागू करता है।
संदर्भ↗
डेली Glue जॉब इंक्रीमेंटल डेटा को प्रोसेस करता है; कल की फ़ाइलों को फिर से प्रोसेस नहीं करना चाहिए।
→Glue जॉब बुकमार्क्स। प्रोसेस किए गए S3 कीज़ / DB पंक्तियों को ट्रैक करें; अंतिम सफल चेकपॉइंट से फिर से शुरू करें।
क्यों: बुकमार्क्स मैन्युअल स्थिति ट्रैकिंग के बिना डुप्लिकेट प्रोसेसिंग से बचते हैं। पूर्ण-प्रक्रिया रन के लिए अक्षम करें।
संदर्भ↗
इवेंट स्ट्रीमिंग के लिए प्रबंधित Kafka बनाम Kinesis Data Streams चुनें।
→मौजूदा Kafka क्लाइंट/इकोसिस्टम होने पर MSK। AWS इंटीग्रेशन (Lambda ट्रिगर, Firehose, KCL) और सर्वरलेस विकल्प के लिए Kinesis।
क्यों: दोनों रीप्ले के साथ स्थायी रूप से स्ट्रीम करते हैं। MSK Kafka API और इकोसिस्टम को संरक्षित करता है; Kinesis छोटे स्ट्रीम के लिए कम लागत पर आता है और मूल रूप से एकीकृत होता है।
संदर्भ↗
परिवर्तनीय Kafka थ्रूपुट; हैंड्स-ऑफ क्लस्टर प्रबंधन चाहते हैं।
→MSK Serverless। ऑटो-स्केल्स पार्टिशन और थ्रूपुट; प्रति पार्टिशन + डेटा भुगतान करें।
क्यों: कोई ब्रोकर साइज़िंग नहीं। निरंतर उच्च थ्रूपुट के लिए, प्रोविज़ंड MSK सस्ता है।
संदर्भ↗
SQS → फ़िल्टर → Step Functions को ग्लू Lambda लिखे बिना कनेक्ट करें।
→EventBridge Pipes। स्रोत → वैकल्पिक फ़िल्टर → वैकल्पिक संवर्धन → लक्ष्य।
क्यों: एक विशिष्ट Lambda-एज़-ग्लू को बदल देता है। कोड, लागत और परिचालन सतह को कम करता है।
संदर्भ↗
स्रोत से फिर से उत्सर्जित किए बिना एक नए उपभोक्ता के माध्यम से पिछले सप्ताह के इवेंट्स को फिर से चलाएं।
→EventBridge संग्रह + रीप्ले। संग्रह मिलान किए गए इवेंट्स को कैप्चर करता है; उन्हें बाद में एक लक्ष्य पर फिर से चलाएं।
क्यों: बिल्ट-इन रीप्ले एक अलग इवेंट स्टोर की आवश्यकता से बचाता है। घटना रिकवरी और नए उपभोक्ताओं को ऑनबोर्ड करने के लिए उपयोगी।
संदर्भ↗
सैकड़ों प्रोड्यूसर इवेंट्स उत्सर्जित करते हैं; उपभोक्ताओं को टाइप किए गए बाइंडिंग की आवश्यकता होती है।
→स्वचालित-खोज के साथ EventBridge Schema Registry। स्ट्रॉन्गली-टाइप्ड कोड बाइंडिंग (Java, Python, TypeScript) उत्पन्न करें।
क्यों: खोज देखे गए इवेंट्स से स्कीमा सीखती है। बाइंडिंग संकलन-समय सुरक्षा प्रदान करते हैं।
संदर्भ↗
उच्च-मात्रा लघु वर्कफ़्लो (>100k/सेकंड) का उप-सेकंड-बिलित ऑर्केस्ट्रेशन।
→Step Functions Express वर्कफ़्लो। प्रति-निष्पादन-एमएस बिलिंग; अधिकतम 5 मिनट।
क्यों: मानक वर्कफ़्लो टिकाऊ + इतिहास-ट्रैक किए गए होते हैं, प्रति स्थिति संक्रमण बिल किए जाते हैं। एक्सप्रेस कम अवधि के प्रवाह पर लागत के लिए ऑडिट ट्रेल का व्यापार करता है।
संदर्भ↗
एक Step Function के माध्यम से समानांतर में 10M S3 ऑब्जेक्ट्स को प्रोसेस करें।
→Distributed Map स्टेट। 10,000 समानांतर तक समवर्ती चाइल्ड निष्पादन; S3 से सीधे स्रोत पढ़ता है।
क्यों: इनलाइन मैप 40 समानांतर पर सीमित है। Distributed Map सेवा कोटा को प्रभावित किए बिना S3-बकेट-साइज़ नौकरियों तक स्केल करता है।
संदर्भ↗
FIFO कतार को >300 संदेश/सेकंड की आवश्यकता है।
→उच्च-थ्रूपुट मोड सक्षम के साथ SQS FIFO। प्रति API प्रति क्षेत्र 70k msg/sec तक; `MessageGroupId` द्वारा विभाजन।
क्यों: मानक FIFO बैचिंग के बिना 300 msg/sec पर सीमित है। उच्च-थ्रूपुट मोड समूह ID द्वारा क्रमबद्धता को विभाजित करता है।
संदर्भ↗
कई उपभोक्ताओं को एक ही Kinesis स्ट्रीम पर पूर्ण रीड थ्रूपुट की आवश्यकता होती है।
→Enhanced Fan-Out (EFO)। प्रत्येक उपभोक्ता को HTTP/2 पुश के माध्यम से एक समर्पित 2 MB/s/shard पाइप मिलता है।
क्यों: डिफ़ॉल्ट पोलिंग 2 MB/s/shard सीमा को उपभोक्ताओं में साझा करता है। EFO उच्च लागत पर विवाद को समाप्त करता है।
संदर्भ↗
S3 में Firehose; डेटा लेक क्वेरीज़ बहुत अधिक स्कैन करती हैं क्योंकि विभाजन इंजेशन समय से होता है, इवेंट समय से नहीं।
→Firehose डायनेमिक विभाजन। JSON से इवेंट-टाइम / टेनेंट ID निकालें; S3 उपसर्ग `year=YYYY/month=MM/tenant=X/` पर लिखें।
क्यों: Athena/Spectrum इवेंट समय पर विभाजन प्रूनिंग स्कैन लागत और लेटेंसी को कम करता है।
संदर्भ↗
मोबाइल/वेब क्लाइंट को वास्तविक समय अपडेट और चयनात्मक फ़ील्ड फ़ेचिंग की आवश्यकता है।
→AWS AppSync (GraphQL) सब्सक्रिप्शन के साथ। WebSocket-समर्थित।
क्यों: GraphQL क्लाइंट केवल अनुरोधित फ़ील्ड्स को फ़ेच करते हैं और डेल्टास की सदस्यता लेते हैं। REST/HTTP API Gateway ओवर-फ़ेच और पोलिंग को मजबूर करता है।
संदर्भ↗
आंतरिक API सार्वजनिक इंटरनेट से पहुंच योग्य नहीं होना चाहिए।
→इंटरफ़ेस VPC एंडपॉइंट के माध्यम से API Gateway निजी एंडपॉइंट। संसाधन नीति विशिष्ट VPCs तक प्रतिबंधित करती है।
क्यों: निजी APIs केवल VPC + कनेक्टेड नेटवर्कों से पहुंच योग्य होते हैं। सार्वजनिक APIs को सुरक्षित होने के लिए WAF + auth की आवश्यकता होती है।
संदर्भ↗
S3 ओरिजिन को लॉक डाउन करें ताकि केवल CloudFront ही उसे पढ़ सके।
→Origin Access Control (OAC)। पुराने OAI को बदलता है; SSE-KMS और सभी S3 सुविधाओं का समर्थन करता है।
क्यों: OAI SSE-KMS ऑब्जेक्ट्स का समर्थन नहीं करता है। AWS सभी नए डिस्ट्रीब्यूशन के लिए OAC की सिफारिश करता है।
संदर्भ↗
S3 में विशिष्ट सशुल्क वीडियो तक पहुंच को समय-सीमित करें।
→CloudFront साइन्ड URLs (प्रति-URL) या साइन्ड कुकीज़ (कई URLs)। विश्वसनीय कुंजी समूह अनुरोधों पर हस्ताक्षर करता है।
क्यों: प्री-साइन्ड S3 URLs CloudFront कैशिंग को बायपास करते हैं। CloudFront साइन्ड URLs एज पर कैश करते हैं और एक्सेस को प्रतिबंधित करते हैं।
संदर्भ↗
हल्का व्यूअर-अनुरोध परिवर्तन: हेडर पुनर्लेखन, रीडायरेक्ट, A/B रूटिंग।
→CloudFront Functions। JS, उप-मिलीसेकंड, सभी एज POPs।
क्यों: Lambda@Edge क्षेत्रीय एज पर पूर्ण Node/Python है — भारी और महंगा। सरल हेरफेर के लिए Functions 10 गुना सस्ते होते हैं।
संदर्भ↗
मजबूत अलगाव के साथ EKS में अविश्वसनीय मल्टी-टेनेंट वर्कलोड चलाएं।
→EKS Fargate प्रति-पॉड अलगाव। प्रत्येक पॉड एक समर्पित माइक्रो-VM में चलता है।
क्यों: प्रबंधित नोड समूह कर्नेल साझा करते हैं — विशेषाधिकार वृद्धि किरायेदारों को पार करती है। Fargate कर्नेल अलगाव EKS में सबसे मजबूत है।
संदर्भ↗
EKS क्लस्टर ऑटोस्केलिंग लेटेंसी बहुत धीमी; नोड समूहों का इंस्टेंस प्रकार का प्रसार।
→Karpenter। प्रावधानकर्ता लंबित पॉड आवश्यकताओं के आधार पर जस्ट-इन-टाइम इंस्टेंस प्रकार चुनता है।
क्यों: Cluster Autoscaler पूर्व-परिभाषित ASGs को स्केल करता है, धीमा और सीमित। Karpenter सेकंड में मनमाने EC2 को विविधीकरण के साथ स्केल करता है।
संदर्भ↗
EKS पॉड को कम से कम विशेषाधिकार IAM की आवश्यकता है (नोड-इंस्टेंस भूमिका साझाकरण से बचें)।
→OIDC प्रदाता के माध्यम से Service Accounts (IRSA) के लिए IAM भूमिकाएं। भूमिका ARN के साथ ServiceAccount को एनोटेट करें।
क्यों: EKS Pod Identity नया विकल्प है — सरल ट्रस्ट मॉडल। IRSA परिपक्व है और क्षेत्रों में काम करता है।
संदर्भ↗
ECS-on-EC2 कार्य प्रारंभ स्केल-आउट के दौरान 5-7 मिनट लगते हैं — <60s की आवश्यकता है।
→CapacityProviderReservation` पर प्रबंधित स्केलिंग लक्ष्य ~80% के साथ ECS Capacity Provider। निष्क्रिय बफर बनाए रखें।
क्यों: आरक्षित बफर का मतलब है कि नए कार्य तत्काल मौजूदा क्षमता पर उतरते हैं जबकि ASG प्रतिस्थापन लॉन्च करता है।
संदर्भ↗
Lambda SQS द्वारा ट्रिगर होता है लेकिन केवल 5% संदेश मेल खाते हैं — व्यर्थ इनवोकेशन।
→फ़िल्टर मानदंडों के साथ इवेंट स्रोत मैपिंग। Lambda केवल मिलान किए गए संदेशों के लिए ही आह्वान किया जाता है।
क्यों: प्री-Lambda फ़िल्टर अप्रासंगिक संदेशों पर प्रति-इनवोकेशन लागत से बचाता है। SQS, Kinesis, DynamoDB, MQ, Kafka पर फ़िल्टरिंग समर्थित है।
संदर्भ↗
प्रोडक्शन ऐप को कम परिचालन ओवरहेड के साथ एक LLM एंडपॉइंट की आवश्यकता है।
→प्रबंधित फ़ाउंडेशन मॉडल (Claude, Llama, Titan) के लिए Amazon Bedrock। SageMaker केवल तभी जब आपको कस्टम मॉडल या ओपन-वेट्स को कसकर ट्यून करने की आवश्यकता हो।
क्यों: Bedrock केवल API है — कोई इंफ्रा नहीं। SageMaker पूर्ण ML प्लेटफ़ॉर्म है — तब चुनें जब आप प्रशिक्षण/फ़ाइन-ट्यूनिंग लाइफ़साइकिल के मालिक हों।
संदर्भ↗
मॉडल को प्रशिक्षित किए बिना दृष्टि / NLP के लिए प्रबंधित AI चुनें।
→Rekognition (छवि/वीडियो लेबल, चेहरे, सामग्री मॉडरेशन)। Comprehend (भावना, संस्थाएं, भाषाएं, PII डिटेक्शन)। Translate। Polly। Transcribe।
क्यों: पूर्व-प्रशिक्षित AWS AI सेवाएं सामान्य कार्यों के लिए पूरे ML लाइफ़साइकिल को छोड़ देती हैं। SageMaker का उपयोग केवल तभी करें जब ऑफ़-द-शेल्फ़ फिट न हो।
संदर्भ↗
वेब ऐप ईमेल/पासवर्ड + Google + Apple + SAML एंटरप्राइज़ SSO का समर्थन करता है।
→होस्टेड UI के साथ Cognito User Pool। OIDC + SAML IdPs कॉन्फ़िगर करें। ऐप Cognito JWT प्राप्त करता है।
क्यों: User Pool IdPs को एक टोकन में एकत्रित करता है। Identity Pool केवल AWS क्रेडेंशियल्स के लिए टोकन बदलता है — AWS API एक्सेस के लिए, auth के लिए नहीं।
संदर्भ↗
दो क्षेत्रों में एक ही कुंजी पर एक साथ राइट्स के साथ DynamoDB Global Tables।
→टाइमस्टैंप द्वारा लास्ट-राइटर-विंस। एप्लिकेशन आइडम्पोटेंट राइट्स डिज़ाइन करता है या क्षेत्रों द्वारा राइट्स को विभाजित करता है।
क्यों: GT प्रतिकृति एसिंक मल्टी-मास्टर है। संघर्ष समाधान टाइमस्टैंप-आधारित है — ऐप्स को अंततः संगतता को सहन करना चाहिए।
संदर्भ↗