کمپیوٹرز, انفارمیشن ٹیکنالوجی
جدید کمپیوٹر وژن. ٹاسکس اور کمپیوٹر وژن ٹیکنالوجی. ازگر میں پروگرامنگ کمپیوٹر وژن
کس تصویر یا تصاویر میں دکھایا گیا ہے کو سمجھنے کے لئے ایک کمپیوٹر سکھانے کی؟ یہ سادہ لگتا ہے، لیکن ایک کمپیوٹر کے لئے اس zeros اور آپ کی اہم معلومات کو نکالنے کے لئے چاہتے ہیں، جس سے لوگ ہیں پر مشتمل صرف ایک میٹرکس ہے.
کمپیوٹر وژن کیا ہے؟ یہ آپ کے کمپیوٹر "دیکھ" کرنے کی صلاحیت ہے
ویژن - اس کا استعمال اس شخص کے لئے معلومات کا ایک اہم ذریعہ ہے، ہم مختلف اندازوں کے مطابق حاصل، 70 سے تمام معلومات کے 90 فی صد کرنے کے لئے. اور ظاہر کی، ہم ایک سمارٹ کار تخلیق کرنے کے لئے چاہتے ہیں تو، ہم ایک ہی مہارت اور کمپیوٹر کو لاگو کرنے کی ضرورت ہے.
کمپیوٹر وژن کے مسئلہ بہت واضح طور پر بیان کیا جا سکتا ہے. "دیکھ" کیا ہے؟ یہ دیکھ کر صرف موجود ہیں کہ جہاں سمجھا جاتا ہے. یہ کمپیوٹر کے وژن اور انسانی وژن کے اختلافات نتیجہ اخذ کیا. ہمارے لیے ویژن - یہ دنیا کے بارے میں علم کا ایک ذریعہ ہے، اسی طرح میٹرک معلومات کا ایک ذریعہ ہے - یہ ہے کہ، فاصلے اور سائز کو سمجھنے کی صلاحیت.
لسانی دانا تصویر
تصویر کو دیکھ کر، ہم اسے صفات کی ایک بڑی تعداد کی طرف سے، تو بات کرنے کی لسانی معلومات نکالنے کے لئے کی وضاحت کر سکتے ہیں.
مثال کے طور پر، اس تصویر کو دیکھ کر، ہم اسے باہر ہے کہ کہہ سکتے ہیں. شہر ٹریفک سے کیا مراد ہے. کاروں نے. ہم اس جنوب مشرقی ایشیا ہے کہ عمارت اور hieroglyphics کے کی ترتیب پر اندازہ لگا سکتے ہیں. ماو Zedong کے پورٹریٹ کو سمجھنے کے لیے اس بیجنگ ہے، اور کسی کو بھی براہ راست ویڈیو کو دیکھا ہے یا خود وہاں گیا تھا تو، اس مشہور سکویر ہے کہ لگتا ہے گا.
کیا ہم تصویر کے بارے میں مزید کہہ سکتا کہ یہ دیکھ کر؟ ہم کہنے کی تصویر میں اشیاء کی نشاندہی کر سکتے ہیں،، لوگ یہاں قریب ہیں - باڑ. یہاں چھاتے، جو کہ عمارت کے پوسٹر. ان کلاسوں کی مثالوں بہت اہم اشیاء، جس لمحے کے لئے کی تلاش میں مصروف ہیں ہے ہے.
پھر بھی ہم خصوصیات یا اشیاء کی صفات میں سے کچھ سیکھ سکتے ہیں. مثال کے طور پر، ہم یہاں اس بات کا تعین کر سکتے ہیں کہ یہ ایک عام چینی، یعنی، ماو Zedong کی تصویر نہیں ہے.
گاڑی کے مطابق میں نے یہ تعین کیا جا سکتا ہے کہ یہ ایک چلتی اعتراض یہ ہے کہ، اور یہ مشکل ہے، اس تحریک کے دوران درست شکل نہیں ہے. جھنڈوں کو یہ اعتراض ہے کہ کہا جا سکتا ہے کے بارے میں، وہ بھی آگے بڑھ رہے ہیں، لیکن وہ مسلسل درست شکل، مشکل نہیں ہیں. اور منظر میں ہوا، پرچم ترقی کی طرف سے مقرر کیا جا سکتا ہے جس میں موجود ہے، اور یہاں تک جیسے وہ بائیں سے دائیں بہہ رہا ہے ہوا کی سمت کا تعین کر سکتے ہیں.
کمپیوٹر وژن میں فاصلے اور حد
بہت اہم کمپیوٹر وژن سائنس کے بارے میں میٹرک معلومات ہے. یہ فاصلے کے تمام قسم ہے. مثال کے طور پر روور کے لئے خاص طور پر اہم ہے ٹیموں زمین سے تقریبا 20 منٹ ہوتے ہیں اور زیادہ سے زیادہ جواب دے کیونکہ. اس کے مطابق، وہاں اور واپس لنک - 40 منٹ. اور ہم نے زمین کی حرکت کا حکم دیتا ہے کے لئے ایک منصوبہ بناتے ہیں تو، آپ کو اس اکاؤنٹ میں لینے کی ضرورت ہے.
کامیابی کے ساتھ ویڈیو گیمز میں کمپیوٹر وژن کی ٹیکنالوجی ضم. ویڈیو کے مطابق، آپ اشیاء، لوگوں کی تین جہتی ماڈل تعمیر کر سکتے ہیں، اور صارف پر تصاویر شہروں میں سے تین جہتی ماڈل کو بحال کر سکتے ہیں. اور پھر ان پر چلنا.
کمپیوٹر وژن - بلکہ وسیع رینج. یہ قریبی مختلف دیگر علوم کے ساتھ گتھی ہوئی ہے. کمپیوٹر وژن کا حصہ اس تصویر پروسیسنگ علاقے کا قبضہ ہے اور کبھی کبھی، کمپیوٹر وژن مختص تاریخی.
تجزیہ، پیٹرن کی منظوری - اعلی انٹیلی جنس کی تخلیق کا راستہ
ہم سے الگ الگ ان تصورات کا جائزہ لیتے ہیں.
امیج پروسیسنگ - تصویر، اور ہم نے اسے کچھ کرنا پڑے گا - اس کی جس میں ان پٹ اور آؤٹ پٹ کے الگورتھم کے ایک علاقے، ہے.
تصویر تجزیہ - دو جہتی تصویر کے ساتھ کام کر رہے ہیں اور اس سے نتائج اخذ کرنے پر مرکوز ہے جس میں کمپیوٹر وژن، کا علاقہ ہے.
پیٹرن کی منظوری - ایک تجریدی ریاضیاتی ڈسپلن ویکٹر کی شکل میں اعداد و شمار کو تسلیم کرتی ہے. کہ دروازے پر ہے - ویکٹر اور ہم اس کے ساتھ کیا کچھ ہے. ویکٹر کہاں ہے، ہم جانتے ہیں کے لئے اتنا اہم نہیں ہیں.
کمپیوٹر وژن - یہ اصل میں دو جہتی تصاویر کی ساخت کو بحال کرنا تھا. آج اس علاقے کے وسیع تر ہو گیا ہے اور یہ طبعی اشیاء بنانے کے تمام کی منظوری کے طور پر تشریح کی جا سکتی ہے تصویر کی بنیاد پر. یہ ہے کہ، یہ کام نہیں ہے مصنوعی ذہانت کی.
دو جہتی تصاویر پر اشیاء کے درمیان فاصلے کی پیمائش - ایک مکمل طور پر مختلف میدان میں کمپیوٹر وژن کے ساتھ متوازی میں، geodesy میں photogrammetry کے تیار کیا گیا ہے.
روبوٹ "دیکھیں" کر سکتے ہیں
اور آخر میں - یہ مشین وژن ہے. مشین وژن کے تحت روبوٹ کی ایک نقطہ نظر کا مطلب ہے. یہی کچھ پیداوار کے مسائل کا فیصلہ ہے. ہم کہہ سکتے ہیں کہ کمپیوٹر وژن - ایک بڑے سائنس ہے. یہ دیگر سائنس حصہ میں سے کچھ کو یکجا کیا. اور کمپیوٹر وژن کسی بھی خاص طور پر درخواست ہو جاتا ہے جب، یہ ایک مشین وژن میں بدل جاتا ہے.
کمپیوٹر وژن خطے عملی ایپلی کیشنز کی ایک وسیع پیمانے پر ہے. یہ پیداوار کے آٹومیشن کے ساتھ منسلک کیا جاتا ہے. ادیموں میں مشین کی طرف سے دستی مزدوری کی جگہ لے لے کرنے کے لئے زیادہ موثر ہو جاتے ہیں. مشین، تھکا ہوا نہیں ملتا سو نہیں، وہ فاسد کام کے شیڈول تھا، وہ ایک سال کے 365 دن کام کرنے کے لئے تیار ہے. لہذا، مشین کے کام کا استعمال کرتے ہوئے، ہم نے ایک گارنٹی شدہ نتیجہ کو ایک مخصوص وقت میں حاصل کر سکتے ہیں، اور یہ بہت دلچسپ ہے. تمام کاموں کمپیوٹر وژن کے نظام کے لئے ایک واضح استعمال ہے. اور صرف حساب کے مرحلے میں تصویر پر فوری طور پر نتائج دیکھنے کے لئے کے مقابلے میں بہتر کچھ نہیں ہے.
مصنوعی ذہانت کی دنیا کی دہلیز پر
پلس علاقے - یہ مشکل ہے! نقطہ نظر کے لئے ذمہ دار دماغ کا ایک اہم حصہ ہے، اور یہ خیال کیا جاتا ہے کہ آپ کو سکھانے تو "دیکھ" کرنے کے لئے آپ کے کمپیوٹر ہے، یہ ہے کہ، مکمل استعمال کمپیوٹر وژن، یہ مکمل مصنوعی ذہانت کے مقاصد میں سے ایک ہے. ہم انسانی سطح پر مسئلے کو حل کر سکتے ہیں، ایک ہی وقت میں سب سے زیادہ امکان ہے، ہم AI کے مسئلے کو حل کریں گے. یہ بہت اچھا ہے! یا بہت اچھا نہیں ہے، آپ کو نظر آتے ہیں، "ٹرمنیٹر 2".
رویا کیوں ہے - یہ مشکل ہے؟ اسی چیز کی تصویر مختلف ہو سکتے ہیں کیونکہ بہت سے بیرونی عوامل پر منحصر ہے. مشاہدے پوائنٹس کے اعتراض پر منحصر ہے مختلف نظر آتے ہیں.
مثال، ایک اور ایک ہی اعداد و شمار کے لئے، مختلف زاویہ سے لیا. اور کیا ایک آنکھ، دو آنکھیں اور ڈیڑھ ہو سکتا شخصیت میں سب سے دلچسپ ہے. اور سیاق و سباق کے لحاظ سے (پینٹ کی آنکھوں کے ساتھ ایک شرٹ میں آدمی کے اس کی تصویر ہو تو)، آنکھوں دو سے زیادہ ہو سکتا ہے.
کمپیوٹر اب بھی سمجھ نہیں ہے، لیکن یہ "دیکھتا"
یہ مشکل بنا دیتا ہے کہ ایک اور عنصر ہے - یہ روشنی کے علاوہ ہے. روشنی کی مختلف کے ساتھ ایک ہی منظر سے مختلف نظر آئے گا. اعتراض کے سائز مختلف ہو سکتے ہیں. اور کسی بھی طبقے کے اعتراض. آپ کو 2 میٹر کی ہے کہ ان کی اونچائی ایک آدمی کے بارے میں کہہ سکتے ہیں کس طرح؟ کچھ بھی نہیں. انسانی ترقی اور 2.3 میٹر، اور 80 سینٹی میٹر ہو سکتا ہے. اشیاء کی دوسری اقسام کے ساتھ کے طور پر، تاہم، ایک ہی کلاس کی اشیاء ہیں.
خاص طور پر زندہ اشیاء اپبھیدوں کی ایک قسم سے گزرنا. ہیئر لوگوں، کھلاڑیوں، جانور. چلانے گھوڑے کی تصاویر کو دیکھو، کیا ان کے ایال کے ساتھ کیا ہو رہا ہے اور دم ناممکن ہے اس بات کا تعین. ایک تصویر میں ایک دوسرے پر حاوی اشیاء؟ آپ ایک کمپیوٹر کی تصویر، بھی سب سے زیادہ طاقتور مشین دھکا تو صحیح فیصلہ دینے کے لئے مشکل تلاش کریں.
اگلا دیکھیں - یہ ایک بھیس ہے. بعض اشیاء، جانوروں کے ماحول کے طور پر ویش، اور بہت skillfully. اور ایک ہی مقامات اور رنگ. بہر حال، ہم انہیں دیکھتے ہیں دور سے اگرچہ ہمیشہ نہیں.
ایک اور مسئلہ - تحریک. ناقابل تصور تحریک میں آبجیکٹ اخترتی گزرنا.
اشیاء کی کئی بہت متغیر ہے. یہاں، مثال کے طور پر "کرسی" کے اشیاء ذیل کے دو تصاویر میں.
اور اس پر آپ بیٹھ سکتے ہیں. لیکن ایک مشین، شکل، رنگ، مواد میں مختلف چیزیں، سب کچھ کسی چیز "کرسی" ہے جیسا کہ سکھانے کے لئے - بہت مشکل ہے. یہ چیلنج ہے. کمپیوٹر وژن کے طریقوں کو ضم کرنے کے لئے -، سمجھ تجزیہ، قیاس آرائی کرنے کی مشین کو سکھانے کے لئے ہے.
مختلف پلیٹ فارمز میں کمپیوٹر وژن کی انٹیگریشن
کمپیوٹر وژن کے بڑے پیمانے پر اس نے سب سے پہلے چہرہ ڈیٹیکٹر پیدا کرتے ہیں، 2001 میں گھسنا شروع کر دیا. وائلا، جونز: ہم اس کے دو مصنفین بنایا. اس سے پہلے تیز رفتار اور قابل اعتماد کافی الگورتھم، مشین سیکھنے کے طریقوں کی طاقت کا مظاہرہ کیا تھا.
انسانی چہرے کی شناخت کو - اب کمپیوٹر وژن کافی نئے عملی ایپلی کیشنز ہے.
لیکن فلموں میں کے طور پر انسان کو تسلیم کرنے کے لئے - بے ترتیب زاویہ، روشنی کی مختلف حالتوں میں - یہ ناممکن ہے. لیکن مسئلہ یہ ہے، یا روشنی کی مختلف کے ساتھ یا ایک مختلف پوز، پاسپورٹ میں تصویر میں کے طور پر اسی طرح میں مختلف لوگوں ہے کہ ایک حل کرنے کے لئے، یہ اعتماد کی ایک اعلی ڈگری کے ساتھ ممکن ہے.
چہرے تسلیم الگورتھم کی خصوصیت کی بڑی وجہ ایک پاسپورٹ تصویر ضروریات.
مثال کے طور پر، آپ کو ایک بایومیٹرک پاسپورٹ موجود ہیں، تو کچھ جدید ہوائی اڈوں میں، آپ کو خود کار طریقے سے پاسپورٹ کنٹرول کا نظام استعمال کر سکتے ہیں.
کمپیوٹر وژن کے انسلجھی مسئلہ - کسی بھی متن کو تسلیم کرنے کی صلاحیت
شاید کسی OCR کے نظام استعمال کیا جاتا ہے. ان میں سے ایک - ایک فائن ریڈر، RuNet نظام میں بہت مقبول ہے. بہت سے فارم آپ کو ڈیٹا میں بھرنے جہاں، وہ بالکل، سکین کر رہے ہیں معلومات بہت اچھی نظام کی طرف سے تسلیم کیا جاتا ہے ہیں. لیکن تصویر میں کسی بھی متن کے ساتھ صورت حال بہت برا ہے. یہ مسئلہ ہنوز حل طلب.
کمپیوٹر وژن شامل کھیل، تحریک پر قبضہ
علیحدہ بڑے علاقے - تین جہتی ماڈل اور تحریک پر قبضہ (کافی کامیابی سے کمپیوٹر گیمز میں لاگو کیا جاتا ہے) کی تخلیق ہے. پہلا پروگرام، کمپیوٹر وژن کا استعمال کرتا ہے - کمپیوٹر اشاروں کا استعمال کرتے ہوئے کے ساتھ بات چیت کا ایک نظام. جب وہ پیدا کیا گیا جو کھلی چیزوں کی ایک بہت تھا.
الگورتھم کافی صرف ڈیزائن کیا گیا ہے، لیکن ترتیب دینے کی یہ ایک ملین تصاویر حاصل کرنے کے لئے لوگوں کی مصنوعی تصاویر کی ایک جنریٹر پیدا کرنے کے لئے لے گئے. ان کے ساتھ سپر کمپیوٹر الگورتھم، جس کے لئے وہ اب بھی کام کرتا ہے کے اجزاء کو منتخب کرنے کے.
یہ ایک ملین تصاویر اور ممکن ہفتے countable سپر کمپیوٹر کا وقت ایک ہی پروسیسر کی صلاحیت کے 12٪ کا استعمال کرتی ہے اور حقیقی وقت میں پوزیشن کو خبر کرنے کے لئے ایک شخص کی اجازت دیتا ہے کہ ایک الگورتھم تخلیق کرنے ہے. یہ مائیکروسافٹ Kinect کے نظام (2010).
مواد طرف سے تصاویر کے لئے تلاش، آپ کے سسٹم کے لئے تصاویر اپ لوڈ کرنے کی اجازت دیتا ہے اور یہ نتائج ایک ہی مواد کے ساتھ تمام تصاویر دے اور ایک ہی زاویہ سے بنایا جائے گا.
کمپیوٹر وژن کی مثالیں: تین جہتی اور دو جہتی نقشے اب اس کے ساتھ کئے جا رہے ہیں. نیویگیشن گاڑیوں کے نقشہ جات باقاعدگی DVR کے مطابق اپ ڈیٹ کیا جاتا ہے.
geotagged تصاویر اربوں کے ساتھ ایک ڈیٹا بیس ہے. ڈیٹا بیس میں تصویر ڈاؤن لوڈ کرنے کی طرف سے، آپ کو اس بات کا تعین کر سکتے ہیں، جہاں اسے بنایا گیا تھا، اور یہاں تک کہ کچھ نقطہ نظر کے ساتھ. کورس کے، فراہم کی ہے کہ جگہ ایک وقت میں کافی ہے کہ نیا سیاح ہے اور علاقے کی تصاویر کی ایک بڑی تعداد وہاں کیا گیا ہے بنا دیا.
روبوٹ ہر جگہ ہیں
کسی بھی طرح اس کے بغیر موجودہ وقت، ہر جگہ پر روبوٹکس. ابھی ڈرائیور (اس کو دیکھنے کے لئے ایک کمپیوٹر پروگرام ایک طرح سے، ڈرائیور کی مدد کرتا ہے) کو حکم دیتا منتقل کرنے پیدل چلنے والوں اور روڈکے نشان کو تسلیم ہے کہ خصوصی کیمروں ہے کہ گاڑیوں موجود ہیں. اور ایک مکمل طور پر خود کار روبوٹک گاڑیاں نہیں ہے، لیکن وہ اضافی معلومات کی ایک بڑی رقم کے استعمال کے بغیر ویڈیو کیمرے کے نظام پر مکمل طور پر انحصار نہیں کر سکتے ہیں.
جدید کیمرے - یہ ایک analogue کیمرے obscura ہے
کی ڈیجیٹل تصویر کے بارے میں بات کرتے ہیں. جدید ڈیجیٹل کیمرے کیمرے obscura کے اصول پر اہتمام کر رہے ہیں. صرف بجائے سوراخ روشنی بیم میں داخل ہوتا ہے اور موضوع سرکٹ کے چیمبر کے پیچھے دیوار پر پیش ہے جس کے ذریعے سے، ہم ایک خاص نظری نظام لینس بلایا ہے. اس اعتراض ایک بڑی روشنی بیم جمع اور تمام شعاعوں پروجیکشن حاصل کرنے اور فلم یا میٹرکس پر ایک تصویر بنانے کے لئے ایک مجازی نقطہ کے ذریعے منظور کیا ہے تاکہ اسے تبدیل کرنا ہے.
جدید ڈیجیٹل کیمرے (میٹرکس) انفرادی عناصر پر مشتمل ہے - پکسلز. ہر پکسل روشنی کی توانائی پکسل کل پر واقعہ ہے جس کی پیمائش، اور ایک پیداوار تعداد میں جاری کرسکتا ہے. لہذا، ایک ڈیجیٹل کیمرے میں، ہم اس کی بجائے ایک واحد پکسل میں پکڑے تصویر چمک سیٹ روشنی پیمائش کے حاصل - کمپیوٹر نقطہ نظر کے میدان. لہذا، ہم دیکھیں تصویر لائنوں اور واضح شکل، اور مختلف رنگوں میں رنگ چوکوں کی ایک گرڈ بہہ نہیں ہے جب - پکسلز.
آپ کو دنیا میں سب سے پہلے ڈیجیٹل تصویر دیکھنے کے ذیل میں.
لیکن اس تصویر میں نہیں ہے؟ رنگ. رنگ کیا ہے؟
رنگ کا نفسیاتی تاثر
رنگین - یہ جو ہم دیکھتے ہیں. ایک ہی بات ایک کے رنگ اور انسانوں اور بلیوں کے لئے مختلف ہو جائے گا. ہم (انسانوں) اور جانور نظری نظام کے بعد سے - نقطہ نظر مختلف ہے. لہذا، رنگ - یہ اشیاء اور روشنی کا مشاہدہ کیا جب اس وقت ہوتی ہے کہ ہمارے نقطہ نظر کی نفسیاتی معیار ہے. اور نہ اعتراض اور روشنی کی ایک جسمانی جائیداد. رنگین - روشنی اجزاء کی بات چیت، اور ہمارے بصری نظام کے منظر کا نتیجہ ہے.
لائبریریوں کا استعمال کرتے ہوئے ازگر میں پروگرامنگ کمپیوٹر وژن
آپ کے کمپیوٹر وژن کے مطالعہ میں سنجیدگی سے مشغول کرنے کا فیصلہ کیا ہے، تو فوری طور پر مشکلات کی ایک بڑی تعداد کے لئے تیار کرنا چاہئے، اس سائنس کا سب سے آسان نہیں ہے اور غلطیوں کی ایک بڑی تعداد چھپاتا ہے. لیکن جنوری یری Solema کی تصنیف "ازگر پر پروگرامنگ کمپیوٹر وژن" - ایک کتاب ہے کہ تمام سب سے زیادہ سادہ زبان کا تعین. یہاں آپ کو 3D میں مختلف اشیاء کے اعتراف کے طریقوں کے ساتھ واقف ہو گا، سٹیریو تصویر، ورچوئل رئیلٹی اور کمپیوٹر وژن کے بہت سے دوسرے پروگراموں کے ساتھ کام کرنے کے لئے معلومات حاصل کریں. کتاب میں ازگر میں کافی مثالیں ہیں. لیکن وضاحتوں بہت زیادہ تحقیق اور مشکل کے اعداد و شمار اوورلوڈ نہیں تو، تو بات کرنے سامانییکرت، پیش کر رہے ہیں. طالب علموں، amateurs کے، اور اتساہی کے لئے مناسب کام کرتے ہیں. لوڈ اس کتاب اور کمپیوٹر وژن (پی ڈی ایف فارمیٹ) کے بارے میں دوسروں کے نیٹ ورک میں ہو سکتا ہے.
اس وقت، کمپیوٹر وژن الگورتھم اور تصویر پروسیسنگ اور عددی یلگوردمز OpenCV کی اوپن سورس لائبریری سے ہیں. یہ سب سے زیادہ جدید پروگرامنگ کی زبانوں پر لاگو کیا جاتا ہے، اوپن سورس ہے. ہم کمپیوٹر وژن کے بارے میں بات کرتے ہیں، ازگر یہ بھی لائبریری کی حمایت حاصل ہے، ایک پروگرامنگ زبان کے طور پر استعمال کرتا ہے، اس کے علاوہ، یہ مسلسل تیار ہے اور ایک بڑی کمیونٹی ہے.
کمپنی "مائیکروسافٹ" اس کی خدمات API-قابل لوگوں کی تصاویر کے ساتھ یہ کام کرنے کے لئے عصبی نیٹ ورک کی تربیت کرنا فراہم کرتا ہے. کمپیوٹر وژن لاگو کرنے کے لئے موقع بھی ہے، ازگر ایک پروگرامنگ زبان کے طور پر استعمال کرتا ہے.
Similar articles
Trending Now