การวิจัยสื่อสังคมออนไลน์ขณะนี้ดำเนินการอยู่ภายใต้ความอคติที่ไม่เข้าร่วม มีอคติหลายประเภทที่ไม่ใช่การมีส่วนร่วมและแต่ละประเภทมีศักยภาพที่จะส่งผลกระทบต่อความน่าเชื่อถือของผลการวิจัยบ่อยครั้งในรูปแบบที่ซ่อนหรือไม่รู้จัก ในความเป็นจริงการวิจัยพบว่าผู้เข้าร่วมการวิจัยเหล่านั้นที่เข้าถึงได้ยากต้องใช้ความพยายามหลายครั้งในการติดต่อกับพวกเขาแตกต่างกันออกไปจากผู้ตอบแบบสอบถามรายอื่น
ความแตกต่างเหล่านี้เกิดจากอายุเพศสถานภาพสมรสสถานะทางเศรษฐกิจและสังคมภาวะสุขภาพและจำนวนบุตรอัตราการตอบสนอง
ขอบเขตที่ข้อมูลในตอนท้ายของการศึกษารวมถึงสมาชิกทั้งหมดในตัวอย่างจะเรียกว่าอัตราการตอบกลับ แม้ว่าแนวคิดนี้มีความชัดเจนในการสำรวจที่มีโครงสร้างหรือชุดของการสัมภาษณ์ แต่ก็มีความคลุมเครือมากขึ้นในการวิจัยสื่อสังคมออนไลน์ แต่ก็มีความสำคัญไม่น้อยในการวิจัยสื่อสังคมมากกว่าในการวิจัยเชิงคุณภาพประเภทอื่น ๆ อัตราการตอบสนองจะคำนวณโดยจำนวนผู้เข้าร่วมที่ทำการสำรวจหรือตกลงที่จะได้รับการสัมภาษณ์หารด้วยจำนวนคนทั้งหมดที่ทำการสุ่มตัวอย่าง จำนวนรวมต้องมีผู้ที่ไม่ได้รับการติดต่อหรือปฏิเสธที่จะเข้าร่วมการวิจัย
ไม่ว่าข้อมูลจะถูกเก็บรวบรวมอย่างไรความสำคัญของอัตราการตอบสนองที่สูงไม่สามารถเน้นได้เพียงพอ
ไม่สามารถสร้างความจริงให้กับประชากรที่มีขนาดใหญ่เมื่ออัตราการตอบสนองของกลุ่มตัวอย่างต่ำ อคติตัวอย่างเพิ่มขึ้นเมื่ออัตราการตอบสนองลดลง ในการสำรวจตามสื่อเมื่ออัตราผลตอบแทนลดลง 20 หรือ 30 เปอร์เซ็นต์ของกลุ่มตัวอย่างกลุ่มผู้เข้าร่วมกลุ่มดังกล่าวมีความคล้ายคลึงกับกลุ่มตัวอย่างโดยรวม
ตัวอย่างขนาด
ตัวอย่างขนาดเล็กมีข้อผิดพลาดในการสุ่มตัวอย่างใหญ่กว่าตัวอย่างขนาดใหญ่ พิจารณาว่าข้อมูลตัวอย่างให้ค่าประมาณของแอตทริบิวต์ของประชากรที่ใหญ่กว่า ตัวอย่างที่ดึงออกมาจากกรอบการสุ่มตัวอย่างให้ค่าประมาณที่แยกจากกันของประชากรกลุ่มใหญ่นั้น ในทางทฤษฎีอาจมีรูปแบบการตอบสนองที่แยกจากกันในแต่ละตัวอย่างสำหรับแต่ละคำถามที่ถาม เมื่อเวลาผ่านไปมีตัวอย่างจำนวนมากที่ดึงมาจากกรอบการสุ่มตัวอย่างรูปแบบที่แท้จริงจะมาบรรจบกันรอบรูปแบบจริงของประชากรกลุ่มใหญ่
ขอบของข้อผิดพลาด
ข้อผิดพลาดในการสุ่มตัวอย่างอธิบายความแม่นยำของการประมาณค่าจากตัวอย่างใด ๆ ที่นำมาจากประชากรกลุ่มใหญ่ข้อผิดพลาดในการสุ่มตัวอย่างจะแสดงเป็นข้อผิดพลาดที่เกี่ยวข้องกับระดับความเชื่อมั่นซึ่งเป็นวิธีการทางสถิติ ในแบบสำรวจความพึงพอใจของประธานาธิบดีตัวอย่างเช่นรายงานอาจแสดงให้เห็นว่าผู้มีสิทธิเลือกตั้งได้รับการสนับสนุนจาก 64% ของผู้มีสิทธิเลือกตั้ง ขอบของข้อผิดพลาดจะเป็นบวกหรือลบ 3 จุดโดยมีระดับความเชื่อมั่น 95%
กล่าวอีกนัยหนึ่งถ้าการสำรวจความคิดเห็นได้ดำเนินการอีกครั้งกับผู้มีสิทธิเลือกตั้ง 100 รายที่แตกต่างกันออกไปจากผู้ลงคะแนน 100 คนผู้มีสิทธิออกเสียง 95 คนจะระบุว่าผู้ที่ได้รับเลือกตั้งเป็นผู้มีสิทธิออกเสียง 61% ถึง 67% ของผู้มีสิทธิเลือกตั้ง นั่นคือ 61% ของผู้มีสิทธิเลือกตั้ง + 3% หรือ -3%
การตัดสินใจเกี่ยวกับขนาดของตัวอย่าง
ขอบของข้อผิดพลาดที่เกี่ยวข้องกับการสุ่มตัวอย่างจะลดลงเมื่อขนาดตัวอย่างขึ้น แต่จะถึงจุดหนึ่งเท่านั้น เมื่อขนาดของตัวอย่างถึง 1000 ถึง 2000 ผู้ตอบแบบสอบถามขอบของข้อผิดพลาดมีขนาดเล็กพอที่จะทำให้การพิจารณาของตัวอย่างขนาดใหญ่ (ไม่เลือกที่มีประสิทธิภาพค่าใช้จ่าย) เมื่อกลุ่มย่อยเป็นส่วนหนึ่งของประชากรที่ใหญ่กว่าขนาดตัวอย่างขนาดใหญ่อาจเป็นเหตุผลได้เนื่องจากขอบของข้อผิดพลาดจะแตกต่างกันไปสำหรับแต่ละกลุ่มย่อยขึ้นอยู่กับจำนวนคนในกลุ่มย่อย ตัวอย่างเช่นให้สมาชิกเครือข่ายโซเชียลมีเดีย 1,000 รายและมีข้อผิดพลาดที่เท่ากับ 1 ถึง 3 คะแนนร้อยละที่มีช่วงความเชื่อมั่น 95% การวิเคราะห์กลุ่มย่อยของเครือข่ายโซเชียลมีเดียซึ่งกล่าวว่า stay-at-home- แม่จำนวนประมาณ 100- จะมีขอบของข้อผิดพลาดที่สูงขึ้นประมาณ 4 ถึง 10 จุด
ตัวอย่างความพอเพียง
ตัวอย่างมักได้รับการประเมินตามขั้นตอนการคัดเลือกที่ใช้แทนที่จะเป็นขนาดหรือส่วนประกอบที่ดีที่สุด นี่เป็นพื้นฐานเพราะในสถานการณ์ส่วนใหญ่ไม่สามารถวัดได้อย่างถูกต้องว่าตัวแทนกลุ่มตัวอย่างเป็นกลุ่มใหญ่อย่างไร ใช้วิธีการทางสถิติเนื่องจากอนุญาตให้ใช้การประมาณความน่าเชื่อถือและพื้นฐานที่เชื่อถือได้ การสร้างช่วงความเชื่อมั่นที่เหมาะสมและส่วนต่างของข้อผิดพลาดในช่วงเริ่มต้นช่วยให้นักวิจัยสามารถมุ่งเน้นไปที่ตัวแปรต่างๆเช่นอัตราการตอบสนองและเฟรมการสุ่มตัวอย่างที่เพียงพอ