جستجو در تالارهای گفتگو
در حال نمایش نتایج برای برچسب های 'ریجکس'.
1 نتیجه پیدا شد
-
با سلام عبارت Regular Expressions به معنی عبارات منظم (اصطلاحات با قاعده ) و مخفف آن re از حروف اول این عبارت گرفته شده است . از کاربرد این مبحث میشه به : استخراج اطلاعات از دیتابیس ها - متون - کد ها - لوگ فایل ها - صفحات گسترده ای با متون زیاد - اسناد و هر چی که داخلش متن باشه . شما با استفاده از این عبارات میتونید اطلاعات <<خاصی>> که مد نظر دارید استخراح کنید. اولین چیزی که نیاز دارید بفهمید اینه که هر چیزی یه کاراکتر به حساب میاد و ما تو اینجا قصد داریم یه تیکه رشته رو از میان یه رشته دیگه بکشیم بیرون که دارای کاراکتر های خاصی هست. نکته : همانطور که گفته شد تمام علایم و حروف و نماد ها و سیمبل ها همگی کاراکتر هستند. مثال : میخواهیم از رشته های زیر abc را جدا کنیم : abcdefg abcde abc خب ما الان فقط abc رو میخوایم پس ریجکس این مثال میشه همون : abc در واقع یافتن صرفا یه کلمه یا یه حرف یا عدد یا ... که میدونیم چیه داخل یه رشته کافیه همون رو بکار ببریم مثلا من میخواستم abc رو از رشته بکشم بیرون پس همین رو به عنوان ریجکس قرار میدم یعنی : abc . مثال دیگر : abc123g-moj حالا من 123 رو میخوام پس فقط ریجکس میشه همون 123 اما یه کار دیگم میتونید بکنید - کاراکتر w\ برای اشاره کردن به حروف زبان انگلیسی و اعداد هست و این کاراکتر به تنهایی یعنی (هر حرف زبان انگلیسی و اعداد) - w مخفف کلمه word هست . مثلا ما در سه رشته بالا میدونیم abc در سمت چپ رشته ها قرار دارد پس برای یافتن abc نوشتن ریجکس زیر کفایت میکند : \w\w\w ریجکس بالا مفهومش این است : از سمت چپ سه حرف انگلیسی یا سه عدد اول رو نشون بده . با گذاشتن یک + در انتهای این کاراکتر میتوانید بگویید تمام کاراکتر هارا به من نشان بده : \w+ یعنی : از سمت چپ تمام حروف انگلیسی و اعداد موجود در رشته هارا در نظر بگیر . پس برای هر رشته جواب همون رشته هاست یعنی : abcdefg ==> \w+ ==> abcdefg abcde ==> \w+ ==> abcde abc ==> \w+ ==> abc نکته بعدی : اگر میخواید از تکرار کاراکتر w\ جلوگیری کنید مثلا بجای اینکه بنویسید w\w\w\ از یه کاراکتر w\ استفاده کنید اما باز نتیجه ی w\w\w\ را بدهد میتوانید از آکولاد استفاده کنید . به مثال زیر توجه کنید: Guardiran ==> \w{4} ==> Guar Mojtaba ==> \w{5} ==> mojta مثال های دیگر : mojtaba ==> \w\w\w ==> moj mojtaba ==> \w+ ==> mojtaba guardiran ==> \w\w\w\w ==> guar Team ==> \w{1,3} ==> Tea --> معنیش میشه اینکه حداکثر تا سه کاراکتر رو نشون بده security ==> \w{3} ==> sec password ==> \w{4} ==> pass 123Guard ==> \w{3} ==> 123 123Guard ==> \w\w\w ==> 123 در درس های بعدی بیشتر با w\ اشنا میشویم پس اگر اشکال دارید بعدا دوباره توضیح خواهیم داد. آموزش نیاز به درک کاملی از رشته ها و کاراکتر ها در پایتون دارد . مبحث ریجکس کار عملیه پس باید حتما پا به پای آموزش بررسی کنید مثال هارو .