
সান ফ্রান্সিসকো, জুন 12, 2024 – সান ফ্রান্সিসকো-ভিত্তিক কৃত্রিম বুদ্ধিমত্তার স্টার্টআপ লুমা এআই তাদের নতুন প্রকাশের মাধ্যমে একটি যুগান্তকারী ঘোষণা করেছে AI সিস্টেম, ড্রিম মেশিন. এই শক্তিশালী প্রযুক্তির সহজ পাঠ্য বিবরণ থেকে উচ্চ-মানের ভিডিও তৈরি করার ক্ষমতা রয়েছে, ভিডিও সামগ্রী তৈরির পদ্ধতিতে বিপ্লব ঘটিয়েছে। ড্রিম মেশিনকে যা আলাদা করে তা হল এর অ্যাক্সেসযোগ্যতা – যে কেউ আজই এটি ব্যবহার করা শুরু করতে পারে।
ড্রিম মেশিন ব্যবহারকারীদের একটি বর্ণনামূলক প্রম্পট ইনপুট করার অনুমতি দিয়ে কাজ করে, যেমন "একটি করগি কুকুরছানা সূর্যাস্তের সময় একটি সৈকতে একটি বল তাড়া করছে"এবং মাত্র দুই মিনিটের মধ্যে, এটি একটি বাস্তবসম্মত পাঁচ-সেকেন্ডের ভিডিও ক্লিপ তৈরি করে যা দৃশ্যের সাথে মিলে যায়৷ বিটা পরীক্ষকরা এখনও তরল গতি এবং সুসংগত গল্প বলার সাথে সাথে নির্দিষ্ট বস্তু, চরিত্র, ক্রিয়া এবং পরিবেশকে সঠিকভাবে রেন্ডার করার ক্ষমতার জন্য সিস্টেমটির প্রশংসা করেছেন।
ড্রিম মেশিন চালু করা AI-চালিত ভিডিও জেনারেশনের গণতন্ত্রীকরণের ক্ষেত্রে একটি বড় মাইলফলক উপস্থাপন করে। যদিও অন্যান্য প্রতিদ্বন্দ্বী সিস্টেম পছন্দ করে OpenAI এর Sora এবং কুয়াইশোর ক্লিং চিত্তাকর্ষক ক্ষমতা প্রদর্শন করেছে, তবে তারা এখনও কিছু নির্বাচিত অংশীদারদের মধ্যে সীমাবদ্ধ। অন্যদিকে, লুমা এআই তাদের ওয়েবসাইটে ড্রিম মেশিন বিনামূল্যে উপলব্ধ করেছে, যার ফলে যে কেউ এই প্রযুক্তি নিয়ে পরীক্ষা-নিরীক্ষা করতে পারবেন। তদুপরি, লুমা AI জনপ্রিয় সৃজনশীল সফ্টওয়্যারের জন্য API এবং প্লাগইন প্রকাশ করার পরিকল্পনা করছে, যা ড্রিম মেশিনের অ্যাক্সেসযোগ্যতা আরও প্রসারিত করবে।
ড্রিম মেশিনের মূল বৈশিষ্ট্য
ড্রিম মেশিন ভিডিওতে সরাসরি প্রশিক্ষিত একটি অত্যন্ত মাপযোগ্য এবং দক্ষ ট্রান্সফরমার মডেলের উপর নির্মিত, যা এটিকে শারীরিকভাবে সঠিক, সামঞ্জস্যপূর্ণ এবং ঘটনাবহুল শট তৈরি করতে সক্ষম করে। এখানে কিছু স্ট্যান্ডআউট বৈশিষ্ট্য রয়েছে:
প্রবেশের প্রতিবন্ধকতা কমিয়ে, ড্রিম মেশিনে উদ্ভাবন এবং সৃজনশীলতার তরঙ্গ ছড়িয়ে দেওয়ার সম্ভাবনা রয়েছে কারণ ব্যবহারকারীরা এর সম্ভাবনাগুলি অন্বেষণ করে এআই-জেনারেটেড ভিডিওএই উন্মুক্ত পদ্ধতি লুমাকে AI এর প্ল্যাটফর্মের চারপাশে স্রষ্টা এবং বিকাশকারীদের একটি প্রাণবন্ত সম্প্রদায় গড়ে তোলার একটি প্রাথমিক সূচনা।
লুমা এআই এর ড্রিম মেশিন একা নয় জেনারেটিভ এআই স্থান স্টার্টআপ এবং টেক জায়ান্টরা টেক্সট ইনপুটগুলি থেকে বাস্তবসম্মত চিত্র, অডিও এবং ভিডিও সংশ্লেষণের জন্য ক্রমবর্ধমান পরিশীলিত সরঞ্জামগুলি বিকাশের জন্য দৌড়াচ্ছে৷ যদিও শিল্প যেমন রূপান্তরের সম্ভাবনা বিনোদন, বিজ্ঞাপন, এবং শিক্ষা অপরিসীম, এখনও পরাস্ত করার চ্যালেঞ্জ আছে। এমনকি সবচেয়ে উন্নত সিস্টেমগুলি নির্দিষ্ট প্রম্পটের সাথে লড়াই করতে পারে বা অর্থহীন বা সমস্যাযুক্ত আউটপুট তৈরি করতে পারে। এই মডেলগুলির গুণমান, ধারাবাহিকতা এবং নির্ভরযোগ্যতা উন্নত করা তাদের সম্পূর্ণ বাণিজ্যিক সম্ভাবনা আনলক করার জন্য গুরুত্বপূর্ণ হবে।
জেনারেটিভের টেক্সট-টু-ভিডিও জেনারেশন সেগমেন্ট AI শিল্প অত্যন্ত প্রতিযোগিতামূলক। উন্মুক্তAI সম্প্রতি একটি নতুন মডেল ঘোষণা করেছে যার নাম Sora, যা ভিজ্যুয়াল কোয়ালিটি এবং ব্যবহারকারীর সাথে আনুগত্য বজায় রেখে এক মিনিট পর্যন্ত দীর্ঘ ভিডিও তৈরি করতে পারে's প্রম্পট। এদিকে, Lightricks Inc. LTX স্টুডিও প্ল্যাটফর্মে আত্মপ্রকাশ করেছে, যা শুধুমাত্র ভিডিও ক্লিপ তৈরি করে না বরং ব্যবহারকারীদের তাদের ভিডিও তৈরি কাস্টমাইজ করার জন্য বিভিন্ন সম্পাদনা টুলও প্রদান করে। অন্যান্য প্রতিযোগী যেমন স্টার্টআপ অন্তর্ভুক্ত পিকা ল্যাবস ইনক. এবং রানওয়ে ইনক., যা বিশেষজ্ঞ টেক্সট-টু-ভিডিও প্রজন্ম।
প্রারম্ভিক বিটা পরীক্ষকরা নির্দিষ্ট বস্তু, চরিত্র, ক্রিয়া এবং পরিবেশকে বিশ্বস্তভাবে রেন্ডার করার, সুসঙ্গত গল্প বলার এবং সর্বত্র তরল গতি বজায় রাখার ক্ষমতার জন্য ড্রিম মেশিনের প্রশংসা করেছেন। যাইহোক, সিস্টেমটি তার চ্যালেঞ্জ ছাড়া নয়। কিছু ব্যবহারকারীর সাথে সমস্যা রিপোর্ট করেছে উত্পন্ন ভিডিওর নির্ভুলতা, বিশেষ করে প্রম্পটে যা জিজ্ঞাসা করা হয়েছিল তা চিত্রিত করার জন্য। এই চ্যালেঞ্জগুলি সত্ত্বেও, সামগ্রিক অভ্যর্থনা ইতিবাচক হয়েছে, অনেক ব্যবহারকারী উচ্চ-রেজোলিউশন, অত্যন্ত বিশদ সামগ্রী এবং অবিশ্বাস্যভাবে মসৃণ, নন-জিটিরি অ্যাকশন দ্বারা প্রভাবিত হয়েছে।
যদিও ড্রিম মেশিনের মতো সরঞ্জামগুলি বাস্তবসম্মত ভিডিও সামগ্রী তৈরি করা আগের চেয়ে সহজ করে তোলে, তারা আরও বাড়িয়ে তোলে নৈতিক এবং আইনগত যে উদ্বেগগুলি এখনও সম্পূর্ণভাবে সমাধান করা হয়নি। অপব্যবহারের সম্ভাবনা, যেমন ডিপফেক এবং ভুল তথ্য তৈরি করা, সেইসাথে লঙ্ঘন মেধা সম্পত্তি অধিকার, তাৎপর্যপূর্ণ। আইন প্রণেতা এবং নিয়ন্ত্রকরা এই সমস্যাগুলির সাথে লড়াই করতে শুরু করেছেন, তবে প্রযুক্তিগত পরিবর্তনের গতি শাসন কাঠামোর বিকাশকে ছাড়িয়ে যাচ্ছে। মধ্যে সঠিক ভারসাম্য খোঁজা নবপ্রবর্তিত বস্তু এবং দায়িত্ব সামগ্রিকভাবে শিল্প এবং সমাজের জন্য একটি সংজ্ঞায়িত চ্যালেঞ্জ হবে।
এই চ্যালেঞ্জ সত্ত্বেও, ড্রিম মেশিনের লঞ্চ সাম্প্রতিক বছরগুলিতে এআই-চালিত ভিডিও তৈরির ক্ষেত্রে অবিশ্বাস্য অগ্রগতির প্রমাণ। প্রযুক্তিটি পরিপক্ক এবং বিকশিত হতে থাকে, এটিতে সৃজনশীলতা এবং অভিব্যক্তির নতুন ফর্মগুলি আনলক করার সম্ভাবনা রয়েছে যা একসময় বিজ্ঞান কল্পকাহিনী হিসাবে বিবেচিত হত। এআই-জেনারেটেড মিডিয়ার বয়স আমাদের উপর, এবং এর প্রভাবগুলি কেবলমাত্র ফোকাসে আসতে শুরু করেছে।
লুমা এআই এর ড্রিম মেশিন এটি একটি যুগান্তকারী হাতিয়ার যা টেক্সট বর্ণনা থেকে উচ্চমানের, বাস্তবসম্মত ভিডিও তৈরিকে গণতন্ত্রায়িত করে। এই প্রযুক্তিকে সকলের জন্য অ্যাক্সেসযোগ্য করে তুলে, লুমা AI ভিডিও কন্টেন্ট তৈরিতে সৃজনশীলতা এবং উদ্ভাবনের এক নতুন যুগের পথ প্রশস্ত করছে। জেনারেটিভ হিসেবে AI শিল্পের বিকাশ অব্যাহত থাকলেও, ড্রিম মেশিন একটি শক্তিশালী এবং বহুমুখী হাতিয়ার হিসেবে দাঁড়িয়েছে যার সম্ভাবনা রয়েছে ভিডিও কন্টেন্ট তৈরি এবং ব্যবহারের পদ্ধতিকে রূপান্তরিত করার।


এটা দারুন! লুমা AI সৃজনশীল প্রক্রিয়ার রূপান্তরের জন্য ড্রিম মেশিন একটি যুগান্তকারী পরিবর্তন বলে মনে হচ্ছে।