نحوه استفاده از RStudio برای ایجاد مدل های پیش بینی ترافیک


در حال حاضر شور و شوق زیادی در صنعت سئو برای پایتون وجود دارد.

این یک زبان برنامه نویسی نسبتا ساده تر برای یادگیری است و از طریق راهنماها و وبلاگ ها برای جامعه SEO قابل دسترسی است.

اما اگر می‌خواهید زبان جدیدی برای تجزیه و تحلیل و تجسم داده‌های جستجوی خود یاد بگیرید، به دنبال R باشید.

این مقاله اصول اولیه نحوه تولید پیش‌بینی سری‌های زمانی در RStudio را از داده‌های کلیک کنسول جستجوی Google شما پوشش می‌دهد.

اما اول، R چیست؟

R یک زبان و محیطی برای محاسبات آماری و گرافیک است پروژه R برای محاسبات آماری.

R جدید نیست و از سال 1993 وجود داشته است. با این حال، یادگیری برخی از اصول R – از جمله نحوه تعامل با API های مختلف Google – می تواند برای SEO مفید باشد.

اگر می خواهید R را به عنوان یک زبان جدید انتخاب کنید، دوره های خوبی برای یادگیری عبارتند از:

اما اگر اصول اولیه را درک می کنید و می خواهید اصول تجسم داده ها را در R بیاموزید، من پروژه هدایت شده Coursera را توصیه می کنم. کاربرد تجزیه و تحلیل داده ها در کسب و کار با برنامه نویسی R.

و سپس شما همچنین باید نصب کنید:

آنچه در زیر می آید مراحل ایجاد مدل های پیش بینی ترافیک در RStudio با استفاده از داده های کلیکی است.

مرحله 1: داده ها را آماده کنید

اولین قدم این است که داده های کنسول جستجوی گوگل خود را صادر کنید. می توانید این کار را از طریق رابط کاربری و صادر کردن داده ها به صورت CSV انجام دهید:

صادرات GSX

یا اگر می‌خواهید داده‌های خود را از طریق RStudio مستقیماً از API کنسول جستجوی Google استخراج کنید، توصیه می‌کنم دنبال کنید. این راهنما از JC Chouinard.

اگر این کار را از طریق رابط انجام دهید، یک فایل فشرده با CSV های مختلف دانلود خواهید کرد، که از آن می خواهید کتاب کار با نام “Dates” را از آن دانلود کنید:

محدوده تاریخ شما می تواند از یک چهارم، شش ماه یا 12 ماه باشد – تنها چیزی که مهم است این است که مقادیر را به ترتیب زمانی داشته باشید که این صادرات به راحتی تولید می کند. (شما فقط باید ستون A را مرتب کنید، بنابراین قدیمی ترین مقادیر در بالا هستند.)


دریافت خبرنامه جستجوی روزانه بازاریابان به آن تکیه می کنند.


مرحله 2: داده های سری زمانی را در RStudio رسم کنید

اکنون باید داده های خود را وارد و رسم کنیم. برای این کار ابتدا باید چهار بسته را نصب و سپس بارگذاری کنیم.

اولین دستوری که باید اجرا شود این است:

## Install packages
install.packages("tidyverse")
install.packages("tsibble")
install.packages("fabletools")
install.packages("bsts")

به دنبال:

## Load packages
library("tidyverse")
library("tsibble")
library("fabletools")
library("bsts")

سپس می خواهید داده های خود را وارد کنید. تنها تغییری که باید در دستور زیر ایجاد کنید، نام نوع فایل (با حفظ پسوند CSV) به رنگ قرمز است:

## Read data
mdat <- read_csv("example data csv.csv",
col_types = cols(Date = col_date(format = "%d/%m/%Y")))

سپس دو دستور آخر در رسم داده‌های شما این است که سری زمانی را به عنوان شیء تبدیل کنید، سپس خود نمودار را رسم کنید:

## Make time series object
ts_data <- mdat %>%
as_tsibble(index = "Date")

به دنبال:

## Make plot
autoplot(ts_data) +
labs(x = "Date", subtitle = "Time series plot")

و در رابط RStudio خود، یک نمودار سری زمانی ظاهر می شود:

مرحله 3: داده های خود را در RStudio مدل سازی و پیش بینی کنید

در این مرحله، مهم است که اذعان کنیم که پیش‌بینی یک علم دقیق نیست و بر چندین حقیقت و مفروضات متکی است. اینها هستند:

  • مفروضاتی مبنی بر اینکه روندها و الگوهای تاریخی باید با درجات مختلف در طول زمان تکرار شوند.
  • پیش‌بینی حاوی خطاها و ناهنجاری‌هایی خواهد بود زیرا مجموعه داده‌های شما (داده‌های کلیک‌های واقعی شما) حاوی ناهنجاری‌هایی است که می‌تواند به عنوان خطا تعبیر شود.
  • پیش‌بینی‌ها معمولاً حول میانگین می‌چرخند و پیش‌بینی‌های گروهی را قابل اعتمادتر از اجرای یک سری پیش‌بینی‌های خرد می‌کند.
  • پیش‌بینی کوتاه‌مدت معمولاً دقیق‌تر از پیش‌بینی با برد بلندتر است.

با خارج شدن از این راه، می‌توانیم مدل‌سازی و پیش‌بینی داده‌های ترافیک خود را آغاز کنیم.

برای این مقاله، داده‌هایمان را به‌عنوان پیش‌بینی سری‌های زمانی ساختاری بیزی (BSTS)، یکی از بسته‌هایی که قبلاً نصب کردیم، تجسم می‌کنم. این نمودار توسط اکثر روش های پیش بینی استفاده می شود.

اکثر بازاریابان این مدل را دیده اند یا حداقل با آن آشنا هستند زیرا معمولاً در بسیاری از صنایع برای اهداف پیش بینی استفاده می شود.

اولین دستوری که باید اجرا کنیم این است که داده هایمان را با مدل BSTS مطابقت دهیم:

ss <- AddLocalLinearTrend(list(), ts_data$Clicks)
ss <- AddSeasonal(ss, ts_data$Clicks, nseasons = 52)
model1 <- bsts(ts_data$Clicks,
state.specification = ss,
niter = 500)

و سپس اجزای مدل را رسم کنید:

plot(model1, "comp")

و اکنون می توانیم پیش بینی های یک و دو ساله را تجسم کنیم.

با بازگشت به قوانین پیش‌بینی کلی که قبلا ذکر شد، هرچه آینده را پیش‌بینی کنید، دقت کمتری خواهد داشت. بنابراین، هنگام انجام این کار به دو سال می مانم.

و همانطور که BSTS یک کران بالا و پایین را در نظر می گیرد، از یک نقطه خاص نیز بسیار بی معنی می شود.

دستور زیر یک پیش‌بینی BSTS آینده یک ساله برای داده‌های شما ایجاد می‌کند:

# 1-year
pred1 <- predict(model1, horizon = 365)
plot(pred1, plot.original = 200)

و نموداری مانند این را برمی گردانید:

نمودار پیش بینی 1 ساله

برای تولید یک نمودار پیش بینی دو ساله از داده های خود، می خواهید دستور زیر را اجرا کنید:

pred2 <- predict(model1, horizon = 365*2)
plot(pred2, plot.original = 365)

و با این کار نموداری مانند این تولید می شود:

نمودار پیش بینی 2 ساله

همانطور که می بینید، محدوده بالا و پایین در پیش بینی یک ساله دارای دامنه ای از 50- تا 150+ بود، در حالی که پیش بینی دو ساله دارای محدوده 200- تا 600+ است.

هرچه آینده را پیش‌بینی کنید، این محدوده بیشتر می‌شود و به نظر من، پیش‌بینی مفیدتر می‌شود.


نظرات بیان شده در این مقاله نظرات نویسنده مهمان است و لزوماً سرزمین موتور جستجو نیست. نویسندگان کارکنان در اینجا فهرست شده اند.


جدید در زمین موتورهای جستجو

درباره نویسنده

دن تیلور

دن تیلور رئیس بخش سئو فنی در آژانس SALT، متخصص سئو فنی مستقر در بریتانیا و برنده جایزه کوئینز 2022. Dan با یک تیم کار می کند و بر آن نظارت می کند که با شرکت هایی از شرکت های فناوری و SaaS گرفته تا تجارت الکترونیک سازمانی کار می کنند.


منبع: https://searchengineland.com/create-traffic-forecasting-models-rstudio-389823