ক্রেগ জেন্ট্রি ২০০৯ সালে প্রমাণ করেছিলেন যে এটি সম্ভব, প্রায় তিন দশক ধরে ক্রিপ্টোগ্রাফাররা ভাবছিলেন এটি আদৌ অস্তিত্ব থাকতে পারে কিনা। ধারণাটি হলো: আপনি আপনার ডেটা এনক্রিপ্ট করুন, অন্য কারো কাছে দিন, তারা সেটিতে গণনা করুক, ফলাফল ফেরত দিক, এবং যখন আপনি সেই ফলাফল ডিক্রিপ্ট করবেন, তখন সেটি সঠিক। যিনি গণনা করেছেন তিনি কখনো আপনার ডেটা দেখেননি। পরিষ্কার করা সংস্করণ নয়। হ্যাশ নয়। আসল অন্তর্নিহিত মানগুলো, কখনো উন্মোচিত হয়নি, এমনকি এক মাইক্রোসেকেন্ডের জন্যও নয়। এটিই হলো ফুলি হোমোমর্ফিক এনক্রিপশন — এনক্রিপশনের একটি রূপ যা একটি তৃতীয় পক্ষকে কখনো ডিক্রিপ্ট না করেই আপনার ডেটায় গণনা চালাতে দেয়।
তাহলে, FHE (ফুলি হোমোমর্ফিক এনক্রিপশন) কী? এটি কোনো কৌশল নয়। এটি নির্দিষ্ট এনক্রিপশন স্কিমের একটি গাণিতিক বৈশিষ্ট্য। আপনি কাউকে একটি তালাবদ্ধ বাক্স পাঠান। তারা বিষয়বস্তু পুনর্বিন্যাস করে। আপনি সেটি খোলেন, এবং বিন্যাসটি সঠিক। তাদের কাছে কখনো চাবি ছিল না।
FHE কীভাবে কাজ করে তা জানার আগে, এটি যে সমস্যার সমাধান করে সে বিষয়ে নির্দিষ্ট হওয়া দরকার, কারণ "সংবেদনশীল ডেটায় গণনা" করার বেশিরভাগ পদ্ধতিতে একটি আপোষ রয়েছে যা মানুষ প্রশ্ন না করেই মেনে নিতে শিখেছে।
প্রচলিত পদ্ধতি: বিশ্রামে এবং স্থানান্তরের সময় ডেটা এনক্রিপ্ট করুন, প্রক্রিয়াকরণের আগে ডিক্রিপ্ট করুন। আপনার ক্লাউড প্রদানকারী, আপনার অ্যানালিটিক্স বিক্রেতা, আপনার ML পরিষেবা—তাদের সবারই তাদের কাজ করতে প্লেইনটেক্সট দরকার। আপনি প্রয়োজনীয়তার কারণে তাদের উপর বিশ্বাস প্রসারিত করেন। এটি তখনই ব্যর্থ হয়: একটি লঙ্ঘন, একটি সমন, একটি অভ্যন্তরীণ হুমকি, একটি ভুল কনফিগার করা অ্যাক্সেস নীতি।
Intel SGX-এর মতো বিশ্বস্ত এক্সিকিউশন এনভায়রনমেন্ট (TEE) একটি সুরক্ষিত মেমরি অঞ্চল তৈরি করে যা এমনকি অপারেটিং সিস্টেমও পড়তে পারে না। সংবেদনশীল গণনা এনক্লেভের ভেতরে হয়। এটি সত্যিকার অর্থে দরকারী, কিন্তু আপনি হার্ডওয়্যার বিক্রেতাকে বিশ্বাস করছেন এবং বাজি ধরছেন যে এনক্লেভ বাস্তবায়নে কোনো কাজে লাগানোযোগ্য ত্রুটি নেই। SGX-এর বেশ কয়েকটি ছিল।
ডিফারেনশিয়াল প্রাইভেসি কোয়েরির ফলাফলে ক্যালিব্রেটেড পরিসংখ্যানগত শব্দ যোগ করে, যা একজন আক্রমণকারী সমষ্টিগত আউটপুট থেকে ব্যক্তি সম্পর্কে কতটা অনুমান করতে পারে তা সীমিত করে। এটি সমষ্টিকরণ রক্ষা করে, পৃথক রেকর্ডে গণনা নয়।
FHE হলো একমাত্র পদ্ধতি যেখানে ডেটা সার্ভারে কখনো ডিক্রিপ্ট হয় না, এবং নিরাপত্তা প্রমাণের জন্য কোনো হার্ডওয়্যার বা তৃতীয় পক্ষের উপর বিশ্বাস করার প্রয়োজন নেই। গ্যারান্টিটি গাণিতিক।
FHE স্কিমগুলো সরাসরি সাইফারটেক্সটে পাটিগাণিতিক অপারেশন সংজ্ঞায়িত করে। এনক্রিপ্টেড মানগুলোতে হোমোমর্ফিক যোগ এবং হোমোমর্ফিক গুণ করলে, ডিক্রিপ্ট করার সময়, অন্তর্নিহিত প্লেইনটেক্সটে সেই অপারেশনগুলো করার মতো একই ফলাফল দেয়।
দুটি অপারেশন সীমিত মনে হয়। আসলে নয়। বাইনারি ফিল্ডে যোগ এবং গুণ আপনাকে AND এবং XOR গেট দেয়, যা আপনাকে যেকোনো ডিজিটাল সার্কিট দেয়। একটি কম্পিউটার যেকোনো ফাংশন গণনা করতে পারে তা এই দুটি অপারেশনের মাধ্যমে প্রকাশ করা যায়। এটিই "এনক্রিপ্টেড সংখ্যায় পাটিগণিত" থেকে "এনক্রিপ্টেড ডেটায় যেকোনো গণনা"-র সেতু।
কাঠামোগত সমস্যা হলো শব্দ (noise)। প্রতিটি FHE অপারেশন সাইফারটেক্সটে একটি ছোট ত্রুটি প্রবর্তন করে। ত্রুটিগুলো জমা হয়। যথেষ্ট অপারেশন চালালে শব্দ সংকেতকে ছাড়িয়ে যায়—সাইফারটেক্সটটি ডিক্রিপ্ট করা অসম্ভব হয়ে পড়ে। জেন্ট্রির অন্তর্দৃষ্টি ছিল বুটস্ট্র্যাপিং: নয়েজি সাইফারটেক্সটে হোমোমর্ফিকভাবে ডিক্রিপশন সার্কিট মূল্যায়ন করে একই প্লেইনটেক্সট মান সহ একটি তাজা, কম-শব্দ সাইফারটেক্সট তৈরি করা। অন্য কথায়, আপনি এনক্রিপশনের ভেতরে ডিক্রিপশন চালান। ডেটা কখনো উন্মোচিত না হয়েই শব্দ পুনরায় সেট হয়।
যেসব স্কিম শব্দ মারাত্মক হওয়ার আগে সীমিত সংখ্যক অপারেশন পরিচালনা করে তাদের লেভেলড বা সামওয়াট হোমোমর্ফিক বলা হয়। বুটস্ট্র্যাপিংই FHE-তে "ফুলি" শব্দটি অর্জন করে।
বেশিরভাগ অ্যাপ্লিকেশনের জন্য, FHE এখনও অনেক ধীর। আজ চলমান অ্যাপ্লিকেশনগুলো একটি প্রোফাইল ভাগ করে নেয়: সীমিত সার্কিট গভীরতা, ডেটার উচ্চ সংবেদনশীলতা, এবং একটি গাণিতিক গোপনীয়তা গ্যারান্টির বিনিময়ে কম্পিউট খরচ বহন করতে পারে এমন একটি পক্ষ।
প্রাইভেট ML ইনফারেন্স হলো সবচেয়ে স্পষ্ট উপযুক্ততা। একটি ক্লায়েন্টের সংবেদনশীল ইনপুট আছে। একটি সার্ভারের একটি মালিকানাধীন মডেল আছে। FHE সার্ভারকে এনক্রিপ্টেড ইনপুটে মডেল মূল্যায়ন করতে এবং একটি এনক্রিপ্টেড ফলাফল ফেরত দিতে দেয়। কোনো পক্ষই তারা যা রক্ষা করছে তা উন্মোচন করে না। Zama নির্দিষ্ট মডেল আর্কিটেকচারের জন্য এটি সরবরাহ করে। সার্কিট গভীরতা অনুমানযোগ্য এবং পরিচালনাযোগ্য।
প্রাইভেট জিনোমিক বিশ্লেষণ ২০১৪ সালে iDASH এনক্রিপ্টেড জিনোমিক্স প্রতিযোগিতা চালু করার পর থেকে একটি বেঞ্চমার্ক ওয়ার্কলোড হয়েছে। রোগের ঝুঁকি স্কোরিং, জিনোম-ওয়াইড অ্যাসোসিয়েশন স্টাডি এবং সিকোয়েন্স অ্যালাইনমেন্ট সবেরই FHE নির্মাণ রয়েছে। জিনোমিক ডেটা হলো কয়েকটি ডেটা ধরনের একটি যেখানে গোপনীয়তার ঝুঁকি স্থায়ী এবং যারা কখনো কিছু শেয়ার করতে সম্মত হননি তাদের কাছেও প্রসারিত হয়।
গোপনীয় আর্থিক কোয়েরি রেঞ্জ কোয়েরি, এনক্রিপ্টেড ডেটাবেস লুকআপ এবং এনক্রিপ্টেড লেনদেনের ইতিহাসে জালিয়াতি স্কোরিং অন্তর্ভুক্ত করে। এই ওয়ার্কলোডগুলো যথেষ্ট কম ঘন ঘন চলে, এবং ডেটা যথেষ্ট সংবেদনশীল, যে কম্পিউট ওভারহেড গ্রহণযোগ্য।
ব্লকচেইন কনফিডেনশিয়ালিটি একটি সক্রিয় ক্ষেত্র। স্মার্ট কন্ট্র্যাক্টগুলো ডিফল্টরূপে অন-চেইনে প্রকাশ্যে কার্যকর হয়। TFHE-ভিত্তিক সিস্টেমগুলো আপনাকে এনক্রিপ্টেড স্টেটে কন্ট্র্যাক্ট লজিক চালাতে দেয়, যা প্রাইভেট নিলাম, গোপনীয় ভোটদান এবং সিলড-বিড মেকানিজমের মতো জিনিস সক্ষম করে যেখানে সঠিকতা প্রকাশ্যে যাচাইযোগ্য কিন্তু ইনপুটগুলো উন্মোচিত হয় না। Zama-র fhEVM প্রকল্প বিশেষভাবে এটিকে লক্ষ্য করে।
FHE নিরাপত্তা Learning With Errors (LWE) এবং এর রিং ভেরিয়েন্ট (RLWE)-এর কঠিনতায় হ্রাস পায়। এই সমস্যাগুলো জিজ্ঞেস করে: একটি রিং বা ল্যাটিসে অনেক আনুমানিক রৈখিক সমীকরণ দেওয়া হলে, গোপনটি পুনরুদ্ধার করুন। ক্লাসিক্যাল বা কোয়ান্টাম হার্ডওয়্যারে কোনোটির জন্যই কোনো পলিনোমিয়াল-টাইম অ্যালগরিদম জানা নেই।
এটি FHE-কে পোস্ট-কোয়ান্টাম ক্রিপ্টোগ্রাফি পরিবারে রাখে। NIST-এর পোস্ট-কোয়ান্টাম স্ট্যান্ডার্ডাইজেশন LWE-পরিবারের সমস্যার উপর নির্মিত, যা অন্তর্নিহিত অনুমানগুলোকে অতিরিক্ত পরীক্ষা-নিরীক্ষা এবং আস্থা দেয়। তবুও, LWE ২০ বছরেরও কম সময় ধরে গুরুতর আক্রমণের মুখে রয়েছে। RSA এবং এলিপটিক কার্ভের পেছনে ৪০+ বছরের ব্যর্থ ক্রিপ্টানালিসিস রয়েছে। আস্থার মাত্রা উচ্চ কিন্তু অভিন্ন নয়।
প্যারামিটারগুলো নিরাপত্তা নিয়ন্ত্রণ করে। পলিনোমিয়াল ডিগ্রি, মডুলাস আকার এবং শব্দ বিতরণ অবশ্যই পছন্দসই নিরাপত্তা স্তরে LWE ইন্সট্যান্সটিকে কঠিন করতে বেছে নিতে হবে। HomomorphicEncryption.org কনসোর্টিয়াম প্রস্তাবিত প্যারামিটার সেট প্রকাশ করে। এই সুপারিশগুলোর বিপরীতে যাচাই করা লাইব্রেরি ডিফল্টগুলো ব্যবহার করা কাস্টম কনফিগারেশনের তুলনায় দৃঢ়ভাবে পছন্দনীয়।
প্রতিযোগিতামূলক প্রসঙ্গ
FHE হলো বেশ কয়েকটি গোপনীয়তা-সংরক্ষণকারী গণনা প্রযুক্তির একটি, এবং সেগুলো ক্রমবর্ধমানভাবে বিকল্প হিসেবে নয়, একসাথে ব্যবহার করা হচ্ছে।
সিকিউর মাল্টি-পার্টি কম্পিউটেশন (MPC) একটি গণনাকে একাধিক পক্ষে বিতরণ করে, যাদের কেউই পূর্ণ ইনপুট দেখে না। নির্দিষ্ট ফাংশনের জন্য এটি প্রায়ই FHE-এর চেয়ে দ্রুত এবং যখন পক্ষগুলো আগাম সংজ্ঞায়িত হয় তখন এটি স্বাভাবিক উপযুক্ততা। FHE একটি একক অবিশ্বস্ত সার্ভারের সাথে কাজ করে।
জিরো-নলেজ প্রুফ (ZKPs) একটি পক্ষকে সাক্ষী প্রকাশ না করেই একটি বিবৃতি সত্য প্রমাণ করতে দেয়। ZKPs প্রমাণ করে; FHE গণনা করে। তারা পরিপূরক, এবং বাস্তব সিস্টেম উভয়ই ব্যবহার করে: FHE প্রাইভেট গণনার জন্য, ZKPs গণনাটি সঠিকভাবে করা হয়েছে তা যাচাই করতে।
FHE এবং MPC একত্রিত করা হাইব্রিড প্রোটোকলগুলো একটি সক্রিয় গবেষণা ক্ষেত্র। একা কোনো প্রযুক্তিই প্রতিটি প্রয়োজনীয়তা পূরণ করে না; সেগুলো একত্রিত করা আপনাকে স্বতন্ত্রভাবে যেকোনোটির চেয়ে ভালো পারফরম্যান্স এবং শক্তিশালী গ্যারান্টি দিতে পারে।


