| تعداد نشریات | 61 |
| تعداد شمارهها | 2,203 |
| تعداد مقالات | 17,958 |
| تعداد مشاهده مقاله | 55,157,985 |
| تعداد دریافت فایل اصل مقاله | 28,873,782 |
سازوکاری برای مدیریت زمان و افزایش دقت اطلاعات هنگام استفاده از کتابخانه سلنیوم | ||
| فصلنامه بازیابی دانش و نظامهای معنایی | ||
| مقاله 7، دوره 11، شماره 41، دی 1403، صفحه 199-225 اصل مقاله (1.19 M) | ||
| نوع مقاله: مقاله پژوهشی | ||
| شناسه دیجیتال (DOI): 10.22054/jks.2024.80235.1660 | ||
| نویسندگان | ||
| فرناز تقی زاده کورایم1؛ محمدرضا کاباران زاد قدیم* 2؛ سیدعبداله امین موسوی1 | ||
| 1گروه مدیریت فناوری اطلاعات، دانشکده مدیریت، واحد تهران مرکزی، دانشگاه آزاد اسلامی، تهران، ایران | ||
| 2گروه مدیریت صنعتی، دانشکده مدیریت، واحد تهران مرکزی، دانشگاه آزاد اسلامی، تهران، ایران | ||
| چکیده | ||
| امروزه دادهها بهعنوان یکی از داراییهای ارزشمند سازمانها و صنایع مختلف، نقش مهمی را در توسعه و پیشرفت کسبوکارها ایفا میکنند. درواقع هر سازمانی برای جمعآوری دادههای خود از منابع مختلفی استفاده میکند که یکی از این منابع بستر وب است که در آن روزانه دادههای زیادی توسط کاربران مختلف و یا حتی رباتها در سراسر جهان تولید و منتشر میشود. جمعآوری و تحلیل چنین دادههایی، میتواند اطلاعات مفیدی را برای سازمان فراهم نماید. به همین منظور طی دهههای گذشته ابزارهای مختلفی توسعه یافتهاند که به برداشت اطلاعات از بستر وب کمک شایانی نمودهاند که ازجمله آنها میتوان به کتابخانههای ریکوئست، سلنیوم، اسکرپی، سوپ زیبا و ... در زبان برنامهنویسی پایتون اشاره نمود. بااینحال، هر یک از این کتابخانهها با چالشهایی مواجه هستند. ما در این مقاله با مطالعه کتابخانه سلنیوم و با توجه به وجود چالشهای متعدد در آن، راهحلی را برای مدیریت زمان و بهبود چالش نامتقارن بودن آن ارائه نمودهایم. آزمایشهای ما نشان میدهد که استفاده از راهحل پیشنهادی، دقت اطلاعات برداشتشده از بستر وب را افزایش و درنتیجه چالش نامتقارن بودن را بهبود میدهد و همچنین زمان برداشت اطلاعات از بستر وب را نیز کاهش میدهد. | ||
| کلیدواژهها | ||
| خزنده وب؛ وب اسکرپینگ؛ کتابخانه سلنیوم؛ نامتقارن بودن داده؛ دقت اطلاعات؛ زمان برداشت اطلاعات | ||
| مراجع | ||
|
Boeing, G., & Waddell, P. (2017). New insights into rental housing markets across the United States: Web scraping and analyzing craigslist rental listings. Journal of Planning Education and Research, 37(4), 457-476. Henrys, K. (2021). Importance of web scraping in e-commerce and e-marketing. Available at SSRN 3769593. Krotov, V., & Tennyson, M. (2018). Scraping Financial Data from the Web Using the R Language. Journal of Emerging Technologies in Accounting, 15(1), 169-181. Krotov, V., Johnson, L., & Silva, L. (2020). Tutorial: Legality and ethics of web scraping. Leotta, M., García, B., Ricca, F., & Whitehead, J. (2023, April). Challenges of end-to-end testing with selenium WebDriver and how to face them: A survey. In 2023 IEEE Conference on Software Testing, Verification and Validation (ICST) (pp. 339-350). IEEE. Neumann, M., Steinberg, J., & Schaer, P. (2017). Web-Scraping for non-programmers: Introducing OXPath for digital library metadata harvesting. Code4Lib Journal, 38. Suganthi, V., & Varun, M. M. (2024). Automation Using Selenium. International Journal Of Multidisciplinary Research In Science, Engineering And Technology, e-ISSN:2582-7219. Teotia, H., Shishodia, G., Tyagi, E., Prakash, A., & Avasthi, S. (2023, April). Instagram Analysis and Activity Automation: Using Python and Selenium Automation Tools. In 2023 International Conference on Computational Intelligence, Communication Technology and Networking (CICTN) (pp. 522-526). IEEE. Yuan, S. (2023). Design and Visualization of Python Web Scraping Based on Third-Party Libraries and Selenium Tools. Academic Journal of Computing & Information Science, 6(9), 25-31. | ||
|
آمار تعداد مشاهده مقاله: 696 تعداد دریافت فایل اصل مقاله: 289 |
||