Skocz do zawartości
Zamknięcie Forum PC LAB

Szanowny Użytkowniku,

Informujemy, że za 30 dni tj. 30 listopada 2024 r. serwis internetowy Forum PC LAB zostanie zamknięty.

Administrator Serwisu Forum PC LAB - Ringier Axel Springer Polska sp. z o.o. z siedzibą w Warszawie: wypowiada całość usług Serwisu Forum PC LAB z zachowaniem miesięcznego okresu wypowiedzenia.

Administrator Serwisu Forum PC LAB informuje, że:

  1. Z dniem 29 listopada 2024 r. zakończy się świadczenie wszystkich usług Serwisu Forum PC LAB. Ważną przyczyną uzasadniającą wypowiedzenie jest zamknięcie Serwisu Forum PC LAB
  2. Dotychczas zamowione przez Użytkownika usługi Serwisu Forum PC LAB będą świadczone w okresie wypowiedzenia tj. do dnia 29 listopada 2024 r.
  3. Po ogłoszeniu zamknięcia Serwisu Forum od dnia 30 października 2024 r. zakładanie nowych kont w serwisie Forum PC LAB nie będzie możliwe
  4. Wraz z zamknięciem Serwisu Forum PC LAB, tj. dnia 29 listopada 2024 r. nie będzie już dostępny katalog treści Forum PC LAB. Do tego czasu Użytkownicy Forum PC LAB mają dostęp do swoich treści w zakładce "Profil", gdzie mają możliwość ich skopiowania lub archiwizowania w formie screenshotów.
  5. Administrator danych osobowych Użytkowników - Ringier Axel Springer Polska sp. z o.o. z siedzibą w Warszawie zapewnia realizację praw podmiotów danych osobowych przez cały okres świadczenia usług Serwisu Forum PC LAB. Szczegółowe informacje znajdziesz w Polityce Prywatności

Administrator informuje, iż wraz z zamknięciem Serwisu Forum PC LAB, dane osobowe Użytkowników Serwisu Forum PC LAB zostaną trwale usunięte ze względu na brak podstawy ich dalszego przetwarzania. Proces trwałego usuwania danych z kopii zapasowych może przekroczyć termin zamknięcia Forum PC LAB o kilka miesięcy. Wyjątek może stanowić przetwarzanie danych użytkownika do czasu zakończenia toczących się postepowań.

Temat został przeniesiony do archiwum

Ten temat przebywa obecnie w archiwum. Dodawanie nowych odpowiedzi zostało zablokowane.

momon

C i Assembler SIMD, problemy z pamięcią

Rekomendowane odpowiedzi

Witam,

napisałem program w C ze wstawkami z Assemblera. Trochę poczytałem o SSE i zabrałem się do pracy, ale wyskakuje mi następujący błąd:

 

asm operand 1 probably doesn't match constraints

 

Niestety nie widzę błędu w swoim kodzie.

 

#include <stdio.h>
#include <stdlib.h>

#define sizeOfNumbers 10
#define randSize 1000       

struct vector 
{
   float x0;
   float x1;
   float x2;
   float x3;
};

struct vector v1[sizeOfNumbers];
struct vector v2[sizeOfNumbers];
struct vector vAdd[sizeOfNumbers];

float randomNumbers()
{
   for(int i=0; i<sizeOfNumbers; i++)
   {
       v1[i].x0 = (float)(rand()%randSize)/100;
       v1[i].x1 = (float)(rand()%randSize)/100;
       v1[i].x2 = (float)(rand()%randSize)/100;
       v1[i].x3 = (float)(rand()%randSize)/100;

       v2[i].x0 = (float)(rand()%randSize)/100;
       v2[i].x1 = (float)(rand()%randSize)/100;
       v2[i].x2 = (float)(rand()%randSize)/100;
       v2[i].x3 = (float)(rand()%randSize)/100;
   }
}

struct vector addSIMD(struct vector a, struct vector b, struct vector sum)
{
   asm(
       "movaps %1, %%xmm0 \n\t"    
       "movaps %2, %%xmm1 \n\t"
       "addps %%xmm0, %%xmm1 \n\t"
       "movaps %%xmm1, %0 \n\t"
       :"=r"(sum)  
       :"r"(a),    
       "r"(b)      
   );

   return sum;
}

int main(void)
{   
srand((unsigned)time(0));
   randomNumbers();

   for(int i=0; i<sizeOfNumbers; i++)
   {
       vAdd[i] = addSIMD(v1[i],v2[i],vAdd[i]);
   }

   return 0;
}

 

Po zmianie "r" na "m"(z rejestrów na pamięć), program się kompiluje, ale jest nadal naruszenie ochrony pamięci(zrzut pamięci).

O co może chodzić?

 

Dodatkowo program tworzę tak:

 

gcc test.c -c -o test.o
gcc test.o -o test

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

Witam,

 

Bawiłem się tym i wydaje mi się, że problem jest taki:

 

Nie wiem jak jest robione w gcc, ale każda wstawka z SIMD, wszędzie tam gdzie będą użyte rejestry wektorowe (XMMy, YMMx, itp) wymagają wyrównania do 16 bajtów (czyli adresy zmiennych użyte do wektorów musza mieć zawsze kończyć się zerem (0). W Visual Studio w C++ do tego służył dodatkowy modyfikator __declspec(align(16)) przed funkcjami z użyciem tych wstawek. W gcc podobno trzeba użyć __attribute__(aligned(16)). Dodatkowo jeszcze stosowane było __vectorcall w Visuala na metody korzystające z tych wstawek (chodziło o szybsze przekazywanie parametrów z funkcji). W końcu użycie SIMD jest po to aby było jak najszybciej.

 

Brak własnie tego ustawienia zawsze generował wyjątek na CPU albo dziwne cuda z wyliczeniami.

 

Generalnie zabawa z SIMD jest ciężka i mało co wychodzi fajnie. Pasuje praktycznie tylko pod wyspecjalizowane biblioteki (np obliczenia vektorowe 2D, 3D i 4D (w tym przypadku chodzi wektory jednorodne czy jakoś tak))

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

  • Ostatnio przeglądający   0 użytkowników

    Brak zarejestrowanych użytkowników przeglądających tę stronę.

×
×
  • Dodaj nową pozycję...