<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Электронный научно-практический журнал «Психология, социология и педагогика» &#187; data analysis</title>
	<atom:link href="http://psychology.snauka.ru/tags/data-analysis/feed" rel="self" type="application/rss+xml" />
	<link>https://psychology.snauka.ru</link>
	<description></description>
	<lastBuildDate>Tue, 13 Jan 2026 12:21:40 +0000</lastBuildDate>
	<language>ru</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.2.1</generator>
		<item>
		<title>Компьютерные методы расчета регрессионных моделей в психологических задачах</title>
		<link>https://psychology.snauka.ru/2014/07/3405</link>
		<comments>https://psychology.snauka.ru/2014/07/3405#comments</comments>
		<pubDate>Wed, 09 Jul 2014 17:06:16 +0000</pubDate>
		<dc:creator>Трухманов Вячеслав Борисович</dc:creator>
				<category><![CDATA[Психология]]></category>
		<category><![CDATA[approximation]]></category>
		<category><![CDATA[data analysis]]></category>
		<category><![CDATA[regression model]]></category>
		<category><![CDATA[the regression equation]]></category>
		<category><![CDATA[анализ данных]]></category>
		<category><![CDATA[аппроксимация]]></category>
		<category><![CDATA[регрессионная модель]]></category>
		<category><![CDATA[уравнение регрессии]]></category>

		<guid isPermaLink="false">https://psychology.snauka.ru/?p=3405</guid>
		<description><![CDATA[Математические методы – это тот инструмент современной науки, который позволяет специалистам из многих отраслей находить оптимальные решения стоящих исследовательских проблем. Применение математических методов в психологии в настоящее время широко и активно развивается. Современные информационные технологии значительно расширили границы применения математических методов в психологических исследованиях. Умение самостоятельно проводить первоначальную статистическую обработку данных экспериментального исследования при помощи [...]]]></description>
			<content:encoded><![CDATA[<p style="text-align: justify;"><span>Математические методы – это тот инструмент современной науки, который позволяет специалистам из многих отраслей находить оптимальные решения стоящих исследовательских проблем. Применение математических методов в психологии в настоящее время широко и активно развивается. Современные информационные технологии значительно расширили границы применения математических методов в психологических исследованиях. </span>Умение самостоятельно проводить первоначальную статистическую обработку данных экспериментального исследования при помощи ЭВМ, а также грамотно подготовить данные для работы со статистическими пакетами является неотъемлемой частью общепрофессиональной компетенции студентов психологических факультетов университетов. Подобные вопросы рассматривались в работах [2], [3], [4], [5], [6].</p>
<p style="text-align: justify;"><span>В психологической практике, как правило, ставиться задача исследования зависимости некоторого признака – зависимой переменной – от влияющих на него факторов – независимых переменных. Подобную зависимость можно выразить в виде математической модели, которую нетрудно построить на основе статистической обработки данных реального психологического эксперимента. Общее название методики построения таких математических моделей – корреляционно-регрессионный анализ.<br />
</span></p>
<p style="text-align: justify;"><span>Все зависимости между переменными делятся на два типа: а) функциональная зависимость; б) статистическая зависимость.<br />
</span></p>
<p style="text-align: justify;"><span> Для функциональной зависимости характерно такое соответствие между зависимой переменной – <em>Y</em> и независимой переменной – <em>Х</em>, при котором каждому значению переменной <em>Y</em> соответствует, как говорят в математике, одно и только одно значение переменной <em>Х</em>. Такое соответствие называется взаимно-однозначным.<br />
</span></p>
<p style="text-align: justify;"><span>Как правило, в реальности редко приходится иметь дело с функциональными связями между переменными. В основном, в ходе эксперимента выявляются статистические зависимости. Это такие зависимости, при которых изменение значений независимой переменной ведет к изменению лишь среднего значения зависимой переменной, а не каждого конкретного.<br />
</span></p>
<p style="text-align: justify;"><span>Описание статистической зависимости возможно несколькими способами. Например, используя всевозможные коэффициенты корреляции. Но большую возможность для интерпретации дает, как говорят в математике, аппроксимация статистической зависимости функциональной. Аппроксимирующая функция – это такая функция, которая наиболее адекватно представляет существующую статистическую зависимость. Методов аппроксимации существует достаточно много, наиболее распространенный, особенно в компьютерных технологиях, – это метод наименьших квадратов. Сущность этого метода заключается в вычислении таких коэффициентов регрессионных уравнений, при которых сумма квадратов отклонений эмпирических значений результативного признака от теоретических, рассчитываемых по найденному уравнению регрессии – минимальна.<br />
</span></p>
<p style="text-align: justify;"><span>График регрессионного уравнения называется линией регрессии. Можно сказать, что она показывает зависимость переменной <em>Y </em>от переменной <em>X </em>в некой идеальной ситуации, в которой отсутствуют случайные, нерегистрируемые факторы.<br />
</span></p>
<p style="text-align: justify;"><span>Регрессионная модель для случая двух переменных (парная регрессия) представляет собой совокупность двух уравнений, являющиеся в простейшем случае уравнениями прямых:<br />
</span></p>
<p style="text-align: center;"><img src="https://psychology.snauka.ru/wp-content/uploads/2014/07/070914_1705_1.png" alt="" /><span><em><br />
</em></span></p>
<p style="text-align: center;"><img src="https://psychology.snauka.ru/wp-content/uploads/2014/07/070914_1705_2.png" alt="" /><span><em>.<br />
</em></span></p>
<p style="text-align: justify;"><span>Таким образом, основной целью регрессионного анализа является расчет численных значений коэффициентов данных уравнений, а также определение их статистической значимости, то есть в подборе такой функциональной зависимости, которая наиболее точно соответствует реальной статистической зависимости между переменными.<br />
</span></p>
<p style="text-align: justify;"><span>Стандартные статистические методы обработки данных включены в состав электронных таблиц, таких как MS Excel и др.; в математические пакеты общего назначения &#8211; Mathcad, Mathlab, Maple и т.д. Наиболее мощные методы статистической обработки представлены в специализированных пакетах – STADIA, STATGRAPHICS, SPSS, STATISTIСA и др.<br />
</span></p>
<p style="text-align: justify;"><span>Табличный процессор Microsoft Excel наиболее часто иcпользуется для анализа экономической информации. Также он может быть достаточно удобен для приобретения первоначальных навыков статистической обработки данных психологического или социологического исследования.<br />
</span></p>
<p style="text-align: justify;"><span>Для проведения статистической обработки данных табличный процессор Microsoft Excel имеет программную надстройку «Пакет анализа», включающую в себя большой набор статистических функций. Для проведения полного и качественного статистического анализа такого набора инструментов бывает часто вполне достаточно. Возможности решения психологических задач для студентов-психологов на основе процессора Microsoft Excel рассмотрим на примере выявления взаимосвязи между переменными величинами.<br />
</span></p>
<p style="text-align: justify;"><span>Линейный регрессионный анализ может быть реализован в режиме «Регрессия» надстройки «Пакет анализа» Microsoft Excel. Основное содержание регрессионного анализа для случая двух переменных и интерпретацию результатов рассмотрим на следующих примерах. Сначала рассмотрим случай линейной регрессии.<br />
</span></p>
<p style="text-align: justify;"><span><strong>Пример 1. </strong>В классическом исследовании Ф. Гальтона (автора термина «регрессия») был измерен рост 205 родителей и 930 их взрослых детей (см. таблицу 1) [1]. С помощью регрессионного анализа им было проиллюстрировано наличие положительной зависимости между ростом родителей и их детей.<br />
</span></p>
<p style="text-align: justify;"><span>Поставим задачу – найти линейную регрессионную модель, которая выявляет зависимость между ростом родителей и ростом их детей, используя инструменты пакета анализа MS Excel.<br />
</span></p>
<p style="text-align: left;"><span>Таблица 1. </span><span style="text-align: center;">Зависимость роста детей от роста их родителей</span></p>
<table width="658" border="1" cellspacing="0" cellpadding="0">
<tbody>
<tr>
<td rowspan="2" width="82">Рост родителей</td>
<td colspan="8" width="510">
<p align="center">Рост детей в дюймах</p>
</td>
<td rowspan="2" width="65">Всего</td>
</tr>
<tr>
<td width="75">
<p align="center">60,7</p>
</td>
<td width="62">
<p align="center">62,7</p>
</td>
<td width="62">
<p align="center">64,7</p>
</td>
<td width="62">
<p align="center">66,7</p>
</td>
<td width="62">
<p align="center">68,7</p>
</td>
<td width="62">
<p align="center">70,7</p>
</td>
<td width="62">
<p align="center">72,7</p>
</td>
<td width="62">
<p align="center">74,7</p>
</td>
</tr>
<tr>
<td width="82">
<p align="center">74</p>
</td>
<td width="75"></td>
<td width="62"></td>
<td width="62"></td>
<td width="62"></td>
<td width="62"></td>
<td width="62"></td>
<td width="62">
<p align="center">4</p>
</td>
<td width="62"></td>
<td width="65">
<p align="center">4</p>
</td>
</tr>
<tr>
<td width="82">
<p align="center">72</p>
</td>
<td width="75"></td>
<td width="62"></td>
<td width="62">
<p align="center">1</p>
</td>
<td width="62">
<p align="center">7</p>
</td>
<td width="62">
<p align="center">11</p>
</td>
<td width="62">
<p align="center">17</p>
</td>
<td width="62">
<p align="center">20</p>
</td>
<td width="62">
<p align="center">6</p>
</td>
<td width="65">
<p align="center">62</p>
</td>
</tr>
<tr>
<td width="82">
<p align="center">70</p>
</td>
<td width="75">
<p align="center">1</p>
</td>
<td width="62">
<p align="center">2</p>
</td>
<td width="62">
<p align="center">21</p>
</td>
<td width="62">
<p align="center">48</p>
</td>
<td width="62">
<p align="center">83</p>
</td>
<td width="62">
<p align="center">66</p>
</td>
<td width="62">
<p align="center">22</p>
</td>
<td width="62">
<p align="center">8</p>
</td>
<td width="65">
<p align="center">251</p>
</td>
</tr>
<tr>
<td width="82">
<p align="center">68</p>
</td>
<td width="75">
<p align="center">1</p>
</td>
<td width="62">
<p align="center">15</p>
</td>
<td width="62">
<p align="center">56</p>
</td>
<td width="62">
<p align="center">130</p>
</td>
<td width="62">
<p align="center">148</p>
</td>
<td width="62">
<p align="center">69</p>
</td>
<td width="62">
<p align="center">11</p>
</td>
<td width="62"></td>
<td width="65">
<p align="center">430</p>
</td>
</tr>
<tr>
<td width="82">
<p align="center">66</p>
</td>
<td width="75">
<p align="center">1</p>
</td>
<td width="62">
<p align="center">15</p>
</td>
<td width="62">
<p align="center">19</p>
</td>
<td width="62">
<p align="center">56</p>
</td>
<td width="62">
<p align="center">41</p>
</td>
<td width="62">
<p align="center">11</p>
</td>
<td width="62">
<p align="center">1</p>
</td>
<td width="62"></td>
<td width="65">
<p align="center">144</p>
</td>
</tr>
<tr>
<td width="82">
<p align="center">64</p>
</td>
<td width="75">
<p align="center">2</p>
</td>
<td width="62">
<p align="center">7</p>
</td>
<td width="62">
<p align="center">10</p>
</td>
<td width="62">
<p align="center">14</p>
</td>
<td width="62">
<p align="center">4</p>
</td>
<td width="62"></td>
<td width="62"></td>
<td width="62"></td>
<td width="65">
<p align="center">37</p>
</td>
</tr>
<tr>
<td width="82">Всего</td>
<td width="75">
<p align="center">5</p>
</td>
<td width="62">
<p align="center">39</p>
</td>
<td width="62">
<p align="center">107</p>
</td>
<td width="62">
<p align="center">255</p>
</td>
<td width="62">
<p align="center">287</p>
</td>
<td width="62">
<p align="center">163</p>
</td>
<td width="62">
<p align="center">58</p>
</td>
<td width="62">
<p align="center">14</p>
</td>
<td width="65">
<p align="center">928</p>
</td>
</tr>
</tbody>
</table>
<p>Решение. Открываем рабочий лист MS Excel (рис. 1) и заносим данные из исходной таблицы (хотя эта процедура достаточно утомительна, нам придется с этим смириться и использовать некоторые хитрости MS Excel).</p>
<table style="border-collapse: collapse;" border="0" align="center">
<colgroup>
<col style="width: 329px;" />
<col style="width: 329px;" /></colgroup>
<tbody valign="top">
<tr>
<td style="padding-left: 7px; padding-right: 7px;">
<p style="text-align: justify;"><img src="https://psychology.snauka.ru/wp-content/uploads/2014/07/070914_1705_3.png" alt="" /></p>
<p style="text-align: center;">Рис. 1. Ввод данных</p>
</td>
<td style="padding-left: 7px; padding-right: 7px;">
<p style="text-align: justify;"><img src="https://psychology.snauka.ru/wp-content/uploads/2014/07/070914_1705_4.png" alt="" /></p>
<p style="text-align: center;">Рис. 2. Окно «Регрессия»</p>
</td>
</tr>
</tbody>
</table>
<p style="text-align: left;"><span style="text-align: justify;">Пакет анализа MS Excel запускается командой </span><em>Анализ данных</em><span style="text-align: justify;"> в меню <em>Сервис</em>. Затем, в открывшемся диалоговом окне кликаем строку </span><em>Регрессия</em><span style="text-align: justify;">. В новом диалоговом окне </span><em>Регрессия</em><span style="text-align: justify;"> задаем ссылки на введенные данные для входных интервалов </span><em>Х</em><span style="text-align: justify;"> и </span><em>Y</em><span style="text-align: justify;"> (рис. 2). Кликнув кнопку Ok, открываем окно вывода результатов, в котором мы видим коэффициенты уравнения регрессии (рис. 3)</span></p>
<p><img class="aligncenter" src="https://psychology.snauka.ru/wp-content/uploads/2014/07/070914_1705_5.png" alt="" /></p>
<p style="text-align: center;"><span>Рис. 3. Окно вывода результатов<br />
</span></p>
<p style="text-align: justify;"><span>Таким образом, искомое уравнение регрессии, которое выражает зависимость роста детей <em>Y</em> от роста их родителей <em>Х</em> имеет вид:<br />
</span></p>
<p style="text-align: center;"><span><em>Y</em> = 0,625<em>X</em> + 25,336.<br />
</span></p>
<p style="text-align: justify;"><span>Иная методика расчета коэффициентов уравнения регрессии в MS Excel может быть применена для случая нелинейной регрессии.<br />
</span></p>
<p style="text-align: justify;"><span><strong>Пример 2.</strong><em><br />
</em>У восьми подростков психолог сравнивает баллы по третьему субтесту теста Векслера (переменная <em>X</em>) и оценки по алгебре (переменная <em>Y</em>).</span></p>
<table border="1" cellspacing="0" cellpadding="0">
<tbody>
<tr>
<td valign="top"> Значения <em>X </em></td>
<td valign="top"> 8</td>
<td valign="top"> 18</td>
<td valign="top"> 18</td>
<td valign="top"> 10</td>
<td valign="top"> 16</td>
<td valign="top"> 10</td>
<td valign="top"> 8</td>
<td valign="top"> 14</td>
</tr>
<tr>
<td valign="top"> Значения <em>Y</em></td>
<td valign="top"> 2</td>
<td valign="top">  3</td>
<td valign="top">  4</td>
<td valign="top">  5</td>
<td valign="top">  4</td>
<td valign="top">  4</td>
<td valign="top"> 3</td>
<td valign="top">  5</td>
</tr>
</tbody>
</table>
<p style="text-align: justify;">Психолога интересует вопрос: на сколько баллов повысится успешность решения третьего субтеста теста Векслера, если оценки по алгебре повысятся на один балл? Кроме того, его интересует вопрос, будет ли повышение успешности решения третьего субтеста теста Векслера на один балл влиять на повышение оценок по алгебре? [1]</p>
<p style="text-align: justify;"><span><em>Решение. </em>Ответы на все эти вопросы даст нам метод регрессии в Microsoft Excel. Применив технологию построения линейной регрессионной модели мы получим уравнение регрессии <em>Y </em>на <em>X</em>:<br />
</span></p>
<p style="text-align: center;"><span><em>Y= </em>3 + 0,06<em>Х</em>,<br />
</span></p>
<p style="text-align: justify;"><span>для которого коэффициент смешанной корреляции будет равен 0,05. С помощью данного коэффициента мы определяем точность аппроксимации: чем ближе его значение к 1 и дальше от нуля, тем точнее уравнение регрессии отражает реальную зависимость. В нашем случае коэффициент корреляции слишком мал, что говорит о неадекватности полученной регрессионной модели.<br />
</span></p>
<p style="text-align: justify;"><span>Наиболее адекватную модель мы сможем выбрать с помощью метода построения диаграмм зависимостей между переменными (рис. 4) и подбором аппроксимирующей<sup><br />
</sup>кривой. В Microsoft Excel представлена возможность выбора одного из пяти видов аппроксимирующих кривых: линейная, степенная, полиномиальная, экспоненциальная и логарифмическая.<br />
</span></p>
<div>
<table style="border-collapse: collapse;" border="0">
<colgroup>
<col style="width: 329px;" />
<col style="width: 329px;" /></colgroup>
<tbody valign="top">
<tr>
<td style="padding-left: 7px; padding-right: 7px;" valign="middle">
<p style="text-align: justify;"><img src="https://psychology.snauka.ru/wp-content/uploads/2014/07/070914_1705_6.png" alt="" /><span><br />
</span></p>
<p style="text-align: center;"><span>Рис. 4. Аппроксимация данных<br />
</span></p>
<p style="text-align: center;"><span>прямой<br />
</span></p>
</td>
<td style="padding-left: 7px; padding-right: 7px;">
<p style="text-align: justify;"><img src="https://psychology.snauka.ru/wp-content/uploads/2014/07/070914_1705_7.png" alt="" /><span><br />
</span></p>
<p style="text-align: center;"><span>Рис. 5. Аппроксимация данных<br />
</span></p>
<p style="text-align: center;"><span>кривой 4-й степени<br />
</span></p>
</td>
</tr>
</tbody>
</table>
</div>
<p style="text-align: justify;"><span>Для данной задачи, если исходить из значения коэффициента смешанной корреляции (равен 0,8), наиболее точно соответствует реальной зависимости между переменными полиномиальная кривая четвертой степени (рис. 5). Уравнение регрессии в этом случае имеет вид:<br />
</span></p>
<p style="text-align: center;"><span><em>Y </em>= 0,002<em>Х</em><sup>4</sup> – 0,07<em>Х</em><sup>3</sup> + 1,007<em>Х</em><sup>2</sup> – 4,7<em>Х</em> + 5<br />
</span></p>
<p style="text-align: justify;"><span>Далее, аналогично, найдем уравнение регрессии <em>X </em>на <em>Y.<br />
</em></span></p>
<p style="text-align: justify;">Наиболее адекватная регрессионная модель получается при аппроксимации данных полиномиальной кривой третьей степени (рис. 6; надо учесть, что в MS Excel зависимая переменная всегда <em>у</em>, а независимая всегда <em>х</em> ) с уравнением</p>
<p style="text-align: center;"><span><em>Х= </em>– 0,2<em>Y</em><sup>3</sup> – 0,2<em>Y</em><sup>2</sup><em> + </em>9<em>Y</em> – 8<br />
</span></p>
<p style="text-align: center;"><img src="https://psychology.snauka.ru/wp-content/uploads/2014/07/070914_1705_8.png" alt="" /><span><br />
</span></p>
<p style="text-align: center;"><span>Рис. 6. Аппроксимация данных </span>кривой 3-й степени</p>
<p style="text-align: justify;"><span>Построив регрессионные модели, мы можем ответить на оба вопроса задачи. Так, согласно Полученным моделям увеличение значений одной переменной приводит к увеличению значения другой переменной только при низких и средних результатах, в то время как высокие показатели по одному параметру вовсе не определяют высоких показателей по другому параметру. <sup><br />
</sup></span></p>
]]></content:encoded>
			<wfw:commentRss>https://psychology.snauka.ru/2014/07/3405/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
