গভীর রাতে বোমা হামলা! Nvidia বিশ্বের সবচেয়ে শক্তিশালী AI চিপ প্রকাশ করেছে, কর্মক্ষমতা 30 গুণ বেড়েছে৷ Huang হল এই যুগের স্টিভ জবস

এইমাত্র, NVIDIA বিশ্বের সবচেয়ে শক্তিশালী AI চিপ প্রকাশ করেছে।

জেনারেটিভ এআই একটি টিপিং পয়েন্টে পৌঁছেছে।

দুই ঘণ্টার GTC 2024 সম্মেলনটি ছিল একটি বড় মাপের কনসার্টের মতো। NVIDIA-এর একজন সিনিয়র বিজ্ঞানী জিম ফ্যান মজা করে বলেছিলেন যে "জেনসেন হুয়াং নতুন টেলর সুইফট।"

এটি সম্ভবত এআই শিল্পে এনভিডিয়ার জেন-সান হুয়াং-এর বর্তমান অবস্থান।

গত বছর, হুয়াং রেনক্সুন বলেছিল যে AI এর "আইফোন মুহূর্ত" এসেছে, আমাদের দেখতে দেয় যে কীভাবে AI দ্বারা দৈনন্দিন জীবন পুনর্লিখন করা হচ্ছে, এবং আজ এটি দেখায় যে এই পরিবর্তনের গতি পাগলের সাথে ত্বরান্বিত হচ্ছে।

বিগত 10 বছরে, NVIDIA প্রায় 1 মিলিয়ন বার AI-কে অগ্রসর করেছে, যা মুরের আইনকে ছাড়িয়ে গেছে। অন্য কথায়, NVIDIA তার নিজস্ব পুনরাবৃত্তি আইন লিখছে। চিপ কম্পিউটিং শক্তি থেকে এআই বাস্তবায়ন, অটোমোবাইল উত্পাদন থেকে মেডিকেল লজিস্টিক পর্যন্ত, এনভিআইডিআইএ তার নিজস্ব অগ্রগতি করার সময় বিভিন্ন শিল্পের বিকাশকে উন্নীত করেছে।

মুরের আইন মৃত, কিন্তু NVIDIA একটি নতুন মুরের আইনের জন্ম দিয়েছে।

কম্পিউটার গ্রাফিক্স কার্ড ব্যতীত, NVIDIA আমাদের দ্বারা স্বাভাবিক সময়ে খুব কমই অনুভূত হয়, কিন্তু আমাদের চারপাশের অনেক পণ্যের প্রযুক্তিগত অগ্রগতি সবসময় তাদের থেকে অবিচ্ছেদ্য। AIGC এর তরঙ্গ।

গত রাতে ওপেনএআই সিইও স্যাম অল্টম্যানের পাঠানো একটি টুইটটি সময়ের পাদটীকা হতে পারে:

ভবিষ্যতের সব বছর ছাড়া এটি মানব ইতিহাসের সবচেয়ে আকর্ষণীয় বছর
এটি মানব ইতিহাসে সবচেয়ে আকর্ষণীয় বছর হয়েছে, তবে এটি ভবিষ্যতে সবচেয়ে বিরক্তিকর বছর হবে।

বিশ্বের সবচেয়ে শক্তিশালী AI চিপের জন্ম হয়েছে, এবং এর পারফরম্যান্স রকেট

এটি বর্তমান বিশ্বের উৎপাদনে সবচেয়ে উন্নত জিপিইউ।

সংবাদ সম্মেলনের নায়ক "Blackwell B200" AI চিপ। Huang Renxun বলেছেন যে এই চিপের নাম এসেছে গণিতবিদ, গেম থিওরিস্ট এবং সম্ভাব্যতা তত্ত্ববিদ ডেভিড ব্ল্যাকওয়েল থেকে।

TSMC-এর 4NP প্রক্রিয়ার উপর ভিত্তি করে, ব্ল্যাকওয়েল আর্কিটেকচারের অধীনে কম্পিউটিং চিপে 104 বিলিয়ন ট্রানজিস্টর রয়েছে, যা আগের প্রজন্মের GH100 GPU-তে 80 বিলিয়ন ট্রানজিস্টরের তুলনায় আরেকটি অগ্রগতি।

ব্ল্যাকওয়েল B200 ঐতিহ্যগত অর্থে একটি একক GPU নয়। এটি দুটি ব্ল্যাকওয়েল GPU + একটি গ্রেস সিপিইউ চিপ দ্বারা গঠিত এবং প্রতিটি চিপ একা চলতে পারে তা নিশ্চিত করার জন্য 10 TB/s NV-HBI (Nvidia হাই ব্যান্ডউইথ ইন্টারফেস) এর মাধ্যমে সংযুক্ত। .

অতএব, B200-এ আসলে 208 বিলিয়ন ট্রানজিস্টর রয়েছে এবং এটি 20 পেটাফ্লপ পর্যন্ত FP4 কম্পিউটিং শক্তি প্রদান করতে পারে। দুটি GPU-এর সাথে একক Grace CPU মিলিত হলে LLM (লার্জ ল্যাঙ্গুয়েজ মডেল) অনুমানের কাজ 30 গুণ বৃদ্ধি করতে পারে।

GB200-এর কর্মক্ষমতাও অনেক উন্নত হবে। 175 বিলিয়ন প্যারামিটার সহ GPT-3 LLM বেঞ্চমার্কে, GB200-এর কর্মক্ষমতা H100-এর থেকে 7 গুণ, এবং এর প্রশিক্ষণের গতি H100-এর চেয়ে 4 গুণ।

আরও কি, এটি H100 এর তুলনায় 25 গুণ কমিয়ে খরচ এবং শক্তি খরচ কমায়।

পূর্বে, যদিও NVIDIA-এর AI প্রসেসর H100 খুব জনপ্রিয় ছিল, প্রতিটি H100-এর সর্বোচ্চ শক্তি খরচ ছিল 700 ওয়াটের মতো, যা সাধারণ আমেরিকান পরিবারের গড় বিদ্যুত খরচকে ছাড়িয়ে গেছে। বিশেষজ্ঞরা ভবিষ্যদ্বাণী করেছেন যে বিপুল সংখ্যক H100 তাদের মোট শক্তি ব্যবহার করে, খরচ তত বেশি হবে যতটা বড় আমেরিকান শহর তুলনীয়, বা তার চেয়েও বড়, কিছু ছোট ইউরোপীয় দেশ।

হুয়াং রেনক্সুন বলেছেন যে 1.8 ট্রিলিয়ন প্যারামিটার মডেলের প্রশিক্ষণের জন্য আগে 8,000 হপার জিপিইউ এবং 15 মেগাওয়াট শক্তির প্রয়োজন ছিল। এখন 2,000 ব্ল্যাকওয়েল জিপিইউ শুধুমাত্র 4 মেগাওয়াট বিদ্যুৎ খরচের সাথে এটি করতে পারে।

ব্ল্যাকওয়েল B200 GPU-এর শক্তিশালী কর্মক্ষমতা শক্তি খরচের ক্ষেত্রেও পুরোপুরি প্রতিফলিত হতে পারে। B200, যা সর্বশেষ NVLink ইন্টারকানেক্ট প্রযুক্তি ব্যবহার করে, একই 8GPU আর্কিটেকচার এবং 400GbE নেটওয়ার্ক সুইচ সমর্থন করে। যদিও এর কার্যকারিতা ব্যাপকভাবে উন্নত হয়েছে, এটি আগের প্রজন্মের H100/H200-এর মতো একই সর্বোচ্চ শক্তি খরচ (700W) অর্জন করতে পারে।

আরেকটি বিষয় লক্ষ্য করার মতো বিষয় হল FP4 এর কম্পিউটিং শক্তি। হুয়াং রেনক্সুন বলেছেন যে গত আট বছরে, এআই কম্পিউটিং শক্তি হাজার গুণ বৃদ্ধি পেয়েছে। সবচেয়ে গুরুত্বপূর্ণ উন্নতি হল দ্বিতীয় প্রজন্মের ট্রান্সফরমার ইঞ্জিন, যা FP4 কম্পিউটিং শক্তির মাধ্যমে কম্পিউটিং, ব্যান্ডউইথ এবং মডেলের আকার উল্লেখযোগ্যভাবে উন্নত করেছে।

সাধারণত AI-তে ব্যবহৃত FP8 কম্পিউটিং পাওয়ারের সাথে তুলনা করে, B200-এর দুটি কম্পিউটিং চিপ H100-এর তুলনায় এর কার্যক্ষমতা 2.5 গুণ বেশি করে। ব্ল্যাকওয়েল আর্কিটেকচারের অধীনে প্রতিটি চিপের কম্পিউটিং শক্তি আগের প্রজন্মের হপার চিপের চেয়ে 25% বেশি।

NVIDIA এর সিনিয়র বিজ্ঞানী জিম ফ্যান নতুন Blackwell B200 GPU কে ​​"একটি নতুন পারফরম্যান্স বিস্ট" বলেছেন।

B200-এর কম্পিউটিং ক্ষমতা একটি একক আর্কিটেকচারের মধ্যে 1 Exaflop-কে ছাড়িয়ে গেছে। Jen-Hsun Huang-এর দ্বারা OpenAI-তে দেওয়া প্রথম DGX-এর কর্মক্ষমতা হল 0.17 Petaflops। GPT-4-1.8T প্যারামিটার 90 দিনের মধ্যে 2,000 ব্ল্যাকওয়েল ইউনিটে প্রশিক্ষিত হতে পারে।

নতুন মুরের আইনের জন্ম হয়েছে বললে অত্যুক্তি হবে না।

যেহেতু ব্ল্যাকওয়েল বেশ কয়েকটি ভিন্ন ভিন্ন সংস্করণে উপলব্ধ, তাই এনভিডিয়া তিনটি প্রধান বিকল্প সহ সম্পূর্ণ সার্ভার নোডের জন্য চশমা সরবরাহ করে।

প্রথমটি হল বৃহত্তম এবং সবচেয়ে শক্তিশালী GB200 NVL72 সিস্টেম, যা 18 1U সার্ভারের সাথে কনফিগার করা হয়েছে, প্রতিটি সার্ভার দুটি GB200 সুপার চিপ দিয়ে সজ্জিত। সিস্টেমটি FP4 AI ইনফারেন্স পারফরম্যান্সের 1440 Peta FLOPS এবং FP8 AI ট্রেনিং পারফরম্যান্সের 720 Peta FLOPS সহ 72 B200 GPU প্রদান করে৷ এটি একটি তরল কুলিং সলিউশন গ্রহণ করবে৷ একটি NVL72 27 ট্রিলিয়ন প্যারামিটার মডেলগুলি পরিচালনা করতে পারে (GPT-4 সর্বাধিক প্যারামিটার নয়৷ 1.7 ট্রিলিয়ন প্যারামিটার অতিক্রম করে)।

আরেকটি বিশেষত্ব হল HGX B200, যা একটি একক সার্ভার নোডে আটটি B200 GPU এবং একটি x86 CPU ব্যবহারের উপর ভিত্তি করে তৈরি করা হয়েছে। প্রতিটি B200 GPU 1000W পর্যন্ত কনফিগার করা যেতে পারে এবং GPU FP4 থ্রুপুটের 18 পেটাফ্লপ প্রদান করে, যা ধীরগতির। GB200 10%-এ GPU-এর চেয়ে।

অবশেষে, NVIDIA HGX B100ও লঞ্চ করবে, যার HGX B200-এর মতোই সাধারণ স্পেসিফিকেশন রয়েছে, একটি x86 CPU এবং 8 B100 GPU দিয়ে সজ্জিত, কিন্তু বিদ্যমান HGX H100 অবকাঠামোর সাথে সরাসরি সামঞ্জস্যপূর্ণ হবে এবং ব্ল্যাকওয়েল GPU-গুলির দ্রুততম স্থাপনার অনুমতি দেবে। , প্রতিটি GPU এর TDP 700W এর মধ্যে সীমাবদ্ধ।

এর আগে, এনভিডিয়া AI চিপ যেমন H100 এবং H200 এর মাধ্যমে একটি মাল্টি-ট্রিলিয়ন-ডলার কোম্পানিতে পরিণত হয়েছে, যা Amazon-এর মতো নেতৃস্থানীয় সংস্থাগুলিকে ছাড়িয়ে গেছে। আজ প্রকাশিত নতুন Blackwell B200 GPU এবং GB200 "সুপার চিপ" খুবই আশাব্যঞ্জক। এটি প্রসারিত হতে পারে এর সীসা এমনকি অ্যাপলকেও ছাড়িয়ে গেছে।

সবকিছু সংজ্ঞায়িত সফ্টওয়্যার যুগ আসছে

2012 সালে, গবেষকদের একটি ছোট দল অ্যালেক্সনেট নামে একটি যুগান্তকারী ইমেজ শনাক্তকরণ সিস্টেম প্রকাশ করেছিল, যা সেই সময়ে কুকুর এবং বিড়ালদের শ্রেণীবিভাগ করার ক্ষেত্রে পূর্ববর্তী পদ্ধতিগুলিকে ছাড়িয়ে গিয়েছিল, এটিকে গভীর শিক্ষা এবং কনভোল্যুশনাল নিউরাল নেটওয়ার্কে একটি নেতা করে তুলেছিল। এর একটি আইকনিক প্রদর্শনী। (CNN) ইমেজ স্বীকৃতির সম্ভাবনা।

AI-তে সুযোগগুলি দেখার পর হুয়াং রেনক্সুন AI-তে সব বাজি ধরার সিদ্ধান্ত নিয়েছিলেন। মজার বিষয় হল যে অতীতে, এটি জেনারেট করা ছবি চিনতে এবং টেক্সট তৈরি করতে ব্যবহৃত হত, কিন্তু এখন এটি পাঠ্যের মাধ্যমে ছবি তৈরি করা হয়।

সুতরাং যখন জেনারেটিভ AI এর তরঙ্গ আসে, তখন আমরা এটি দিয়ে কী করতে পারি? জেন-সান হুয়াং কিছু মানসম্মত উত্তর দিয়েছেন।

NVIDIA-এর আবহাওয়া মডেল কর্ডিফের সাথে মিলিত ঐতিহ্যগত আবহাওয়া মডেলগুলি এমন পূর্বাভাস অর্জন করতে পারে যা শত শত বা এমনকি হাজার হাজার কিলোমিটার এলাকা অন্বেষণ করে, টাইফুনের মতো প্রভাবের পরিসীমা প্রদান করে, যার ফলে সম্পত্তির ক্ষতি কম হয়। ভবিষ্যতে আরও দেশ ও অঞ্চলের জন্য কর্ডিফ উন্মুক্ত থাকবে।

জেনারেটিভ AI শুধুমাত্র ডিজিটাল ক্ষমতার মাধ্যমে ছবি এবং অডিও বুঝতে পারে না, কিন্তু নতুন ওষুধের স্ক্রিন আউট করার জন্য কোটি কোটি যৌগ স্ক্যান করতে এর বিশাল কম্পিউটিং শক্তি ব্যবহার করতে পারে।

একজন AI অস্ত্র ব্যবসায়ী হিসেবে, Huang Renxun NiMS সিস্টেমও চালু করেছেন, যেটি AI চিপ তৈরিতে সহায়তা করে। ভবিষ্যতে, আপনি একটি AI সুপার টিম গঠন করার সুযোগও পেতে পারেন। টাস্কটিকে সাবটাস্কের একটি সিরিজে ভাগ করার পরে, আপনি বিভিন্ন AI-কে পুনরুদ্ধার এবং সফ্টওয়্যার অপ্টিমাইজেশনের মতো সম্পূর্ণ কাজগুলি করতে দিতে পারেন।

ভবিষ্যতের সুবিধা, গুদাম এবং কারখানা ভবনগুলি সফ্টওয়্যার-সংজ্ঞায়িত করা হবে।

হিউম্যানয়েড রোবট হোক, স্ব-চালিত গাড়ি হোক বা অস্ত্র চালান, এই স্বায়ত্তশাসিত রোবটগুলির জন্য সফ্টওয়্যার-স্তরের অপারেটিং সিস্টেম প্রয়োজন। উদাহরণস্বরূপ, AI এবং Omniverse এর সমন্বয়ের মাধ্যমে, NVIDIA 100,000 বর্গ মিটার এলাকা জুড়ে একটি রোবট গুদাম তৈরি করেছে।

এই শারীরিকভাবে নির্ভুল সিমুলেটেড পরিবেশে, 100টি সিলিং-মাউন্ট করা ক্যামেরা NVIDIA মেট্রোপলিস সফ্টওয়্যার এবং স্বায়ত্তশাসিত মোবাইল রোবট (AMRs) এর রুট পরিকল্পনার ক্ষমতা ব্যবহার করে রিয়েল টাইমে গুদামের সমস্ত কার্যকলাপ ম্যাপ করে।

এই সিমুলেশনগুলিতে এআই এজেন্টের সফ্টওয়্যার লুপ টেস্টিং অন্তর্ভুক্ত রয়েছে যা বাস্তব বিশ্বের অনির্দেশ্যতার সাথে খাপ খাইয়ে নেওয়ার সিস্টেমের ক্ষমতাকে মূল্যায়ন এবং অপ্টিমাইজ করার জন্য।

একটি সিমুলেটেড পরিস্থিতিতে, এএমআর একটি প্যালেট তুলতে যাওয়ার পথে একটি ঘটনার সম্মুখীন হয়েছিল, তার উদ্দেশ্যমূলক রুটটি ব্লক করে। Nvidia Metropolis তারপর আপডেট করে এবং নিয়ন্ত্রণ ব্যবস্থায় একটি রিয়েল-টাইম অকুপেন্সি ম্যাপ পাঠিয়েছে, যা নতুন সর্বোত্তম পথের হিসাব করেছে।

গুদাম অপারেটররাও প্রাকৃতিক ভাষার মাধ্যমে ভিজ্যুয়াল মডেলের কাছে প্রশ্ন জিজ্ঞাসা করতে পারে এবং মডেলটি বিশদ এবং কার্যকলাপগুলি বুঝতে পারে এবং অপারেশনাল দক্ষতা উন্নত করার জন্য তাত্ক্ষণিক প্রতিক্রিয়া প্রদান করতে পারে।

উল্লেখ্য যে অ্যাপল ভিশন প্রোও এই সম্মেলনে হাজির হয়েছিল। এন্টারপ্রাইজগুলি অমনিভার্স ক্লাউডের মাধ্যমে রিয়েল টাইমে ভিশন প্রো-তে 3D অ্যাপ্লিকেশনগুলির ইন্টারেক্টিভ ইউনিভার্সাল দৃশ্যের বর্ণনা (ওপেন ইউএসডি) সহজে স্ট্রিম করতে পারে, যা ব্যবহারকারীদের ভার্চুয়াল জগতগুলি আগে কখনও অন্বেষণ করতে সহায়তা করে।

প্রেস কনফারেন্সের সমাপ্তি ছিল পরিচিত রোবট সেগমেন্ট। হুয়াং রেনক্সুন যেমন বলেছিলেন, যে মুহুর্তে তিনি তার হাত খুলেছিলেন এবং অন্যান্য মানবিক রোবটের সাথে দাঁড়িয়েছিলেন, এই সময়ে, "কম্পিউটার গ্রাফিক্স, পদার্থবিদ্যা এবং কৃত্রিম বুদ্ধিমত্তার সংযোগস্থল, এই… এই মুহুর্তে সবকিছু শুরু হয়।"

▲ ছোট ইস্টার ডিম

দশ বছর আগে GTC-তে, জেন-সান হুয়াং প্রথম মেশিন লার্নিং এর গুরুত্বের উপর জোর দিয়েছিলেন। যদিও অনেক লোক এখনও এনভিডিয়াকে "গেম গ্রাফিক্স কার্ড" প্রস্তুতকারক হিসাবে বিবেচনা করে, তারা ইতিমধ্যেই এআই বিপ্লবের অগ্রভাগে ছিল।

2024 সালে, AI অ্যাপ্লিকেশনের প্রথম বছর হিসাবে পরিচিত, NVIDIA ইতিমধ্যেই অনেক ক্ষেত্রে বিভিন্ন শিল্পকে শক্তিশালী করার জন্য AI সফ্টওয়্যার এবং হার্ডওয়্যার ব্যবহার করেছে: বড় ভাষা মডেল, কথোপকথনমূলক AI, প্রান্ত কম্পিউটিং, বড় ডেটা, স্বায়ত্তশাসিত ড্রাইভিং, বায়োনিক রোবট…

ওষুধ আবিষ্কার আমাদের দক্ষতা নয়, কম্পিউটিং হল; গাড়ি তৈরি করা আমাদের দক্ষতা নয়, গাড়ি তৈরির জন্য প্রয়োজনীয় AI কম্পিউটারগুলি। সত্যি কথা বলতে কি, একটি কোম্পানির জন্য এই সব বিষয়ে ভালো হওয়া কঠিন, কিন্তু আমরা এর AI কম্পিউটিং অংশে খুব ভালো।

একটি একক শিল্পের নেতার সাথে তুলনা করলে, NVIDIA অনেকটা "পর্দার আড়ালে বড় লোক।" যতক্ষণ AI উল্লেখ করা হয়, NVIDIA অবশ্যই একটি অনিবার্য বিষয় হতে হবে।

যেমন হুয়াং বলেছেন, NVIDIA ইতিমধ্যে একটি প্ল্যাটফর্ম কোম্পানি।

এটি ছিল অগ্রিম স্থাপনা এবং ঐতিহাসিক উন্নয়নের সাধারণ প্রবণতা যা এনভিডিয়াকে AI যুগের শুরুতে AI চিপ বাজারের 70% এর বেশি বিক্রয় দখল করতে সক্ষম করেছিল। কোম্পানির মূল্যায়নও US$2 ট্রিলিয়ন ছাড়িয়ে যায় না অনেক আগে.

সম্ভবত এই কারণেই অ্যাপল বহু বছর ধরে সংগ্রাম করার পরে গাড়ি তৈরি করা ছেড়ে দিয়েছে এবং জেনারেটিভ AI-তে প্রচুর বিনিয়োগ করেছে৷ তা অর্থনৈতিক সুবিধা হোক বা প্রযুক্তিগত প্রবণতা, এটি একটি জুয়া খেলার যোগ্য৷

এমন একটি সময়ে যখন আমরা এখনও "AI" এর উপযোগিতা নিয়ে প্রশ্ন তুলছি, NVIDIA ক্রিয়াকলাপের মাধ্যমে প্রমাণ করেছে যে AI নতুন যুগের একটি অপরিহার্য অংশ হয়ে উঠেছে৷

লেখক: লি চাওফান, জিয়াও ফানবো, মো চংইউ

# aifaner: aifaner (WeChat ID: ifanr) এর অফিসিয়াল WeChat পাবলিক অ্যাকাউন্ট অনুসরণ করতে স্বাগতম। যত তাড়াতাড়ি সম্ভব আপনাকে আরও উত্তেজনাপূর্ণ সামগ্রী সরবরাহ করা হবে।

Ai Faner | আসল লিঙ্ক · মন্তব্য দেখুন · Sina Weibo